Проблема эмпирической проверки математической гипотезы
В классической физике ход исследования шел таким путем, что вначале создавалась теоретическая модель (она вводилась как гипотетическая конструкция, а затем специально доказывалось, что в ней содержатся существенные черты обобщаемых экспериментальных ситуаций) и лишь после этого выводились математические выражения для законов теории. Последние возникали как результат выявления связей абстрактных объектов теоретической модели и выражения их в языке математики. Вводимые таким способом уравнения сразу же получали адекватную интерпретацию и связь с опытом.
При таком построении не было трудностей в эмпирическом обосновании уравнений. Но в современной физике дело обстоит иначе. Физика, применяя метод математической гипотезы, стала создавать уравнения до построения правил соответствия, которые связывают величины, фигурирующие в уравнениях, с объектами опыта, и тогда возникли определенные затруднения, связанные с поиском интерпретации уравнений[29].
Нам хотелось бы подчеркнуть, что суть этих затруднений состоит не в том, что на первых порах математическая гипотеза вводится без какой бы то ни было интерпретации. В таком случае гипотетические уравнения вообще не могли бы претендовать на роль выражений для физических законов, а были бы только формулами чистой математики. Коль скоро определенные символы в уравнениях рассматриваются как физические величины, интерпретация уравнений неявно предполагается. Но все дело в том, что гипотетическим уравнениям первоначально, как правило, приписывается неадекватная интерпретация. Объясняется это следующим. При формулировке математической гипотезы перестраиваются уравнения, ранее выражавшие физические законы некоторой области. Такие выражения были соединены с соответствующей теоретической моделью (схемой), которая обеспечивала их интерпретацию. Величины, связанные в них, фиксировали признаки абстрактных объектов данной модели. Но как только исходное уравнение было подвергнуто перестройке, то тем самым физические величины получили новые связи, а значит, и новые определения в рамках новых уравнений. Однако в мышлении физика эти величины по-прежнему соединены с представлениями об абстрактных объектах старой теоретической модели. Поэтому, осуществив математическую экстраполяцию вместе с физическими величинами, связи которых устанавливаются в уравнении, он заимствует такие объекты и пытается их использовать с тем, чтобы интерпретировать полученные уравнения. В соответствии с новыми связями физических величин в уравнениях он приписывает абстрактным объектам новые признаки и устанавливает их корреляции. Так появляется гипотетическая модель, которая выдается за изображение существенных черт новой области взаимодействий. Однако в качестве таковой она не обоснована. Не проверено, можно ли вывести составляющие ее объекты (с их новыми признаками) путем идеализаций и предельных переходов из реальных предметных отношений новой области. Поэтому очень велика вероятность, что гипотетическая интерпретация новых уравнений окажется неверной. В этом случае, если сразу проверить уравнения, сопоставляя их с данными эксперимента, результаты проверки могут привести к рассогласованию уравнений с опытом, даже если уравнения продуктивны.
Чтобы рассмотреть эту сторону вопроса подробно, разберем уже ставший хрестоматийным пример: обоснование релятивистского уравнения Дирака. Известно, что, построив в полном соответствии с канонами метода математической гипотезы систему четырех линейных дифференциальных уравнений первого порядка для четырех независимых волновых функций, Дирак получил в качестве одного из основных математических следствий такие решения, которые соответствовали отрицательным значениям массы покоя (полной энергии) для свободной частицы.
Обычно считают, что сравнение с опытом этих следствий сразу привело к предсказанию позитрона. Однако в действительности дело обстояло намного сложнее. Первоначальное сопоставление следствий уравнений Дирака с опытом привело к таким предсказаниям, после которых уравнение казалось невозможно спасти.
Наиболее экстравагантными и явно противоречащими опыту были выводы о возможности самопроизвольного исчезновения электронов и, как следствие, о неустойчивости атома водорода.
Нетрудно убедиться, что эти выводы настолько резко противоречили всему экспериментальному багажу атомной физики, что их было бы достаточно, чтобы отвергнуть уравнение Дирака как неудачную математическую экстраполяцию. Но все дело в том, что указанные следствия были навязаны не свойствами уравнения Дирака, а его первоначальной интерпретацией. Поскольку уравнение было получено из классического соотношения между массам и энергией для одной частицы и содержало обычное выражение для квантовомеханического оператора импульса этой частицы, постольку совершенно естественным казалось, что уравнение Дирака описывает поведение отдельно взятой квантовомеханической частицы в условиях, когда с нее сняты нерелятивистские ограничения[30]. Иначе говоря, модификация традиционных квантовомеханических уравнений в релятивистское уравнение для электрона сопровождалась введением новой системы абстрактных объектов, которые заимствовались из теоретических моделей нерелятивистской квантовой механики и наделялись новыми признаками. Решение уравнений Дирака указывало на существование областей с положительной и отрицательной энергией, разделенных энергетическим барьером; в 2mc2. Тем самым уравнения вводили следующую систему абстрактных, теоретических объектов: “частица” (в квантовомеханическом смысле, но способная двигаться с релятивистскими скоростями), “область положительных энергий” и “область отрицательных энергий”. В соответствии с общими принципами квантовой механики частица с зарядом е и массой m, оказывалась способной проходить сквозь барьер между этими областями под влиянием сколь угодно малого электромагнитного воздействия и попадать в область отрицательных энергий. Ввиду того, что уравнение Дирака не содержало никаких ограничений “снизу” на возможную величину отрицательной энергии (--<Е--mc2), следовало, что любая частица, однажды попав в область с отрицательной энергией и стремясь к состоянию с наименьшей энергией (принцип устойчивости системы), должна падать в бездонную энергетическую яму, с равной нулю вероятностью вновь возвратиться в область положительных энергий. Нетрудно заметить, что указанные выше парадоксальные выводы из уравнения Дирака так или иначе были связаны с такого рода эффектом “бесследного” исчезновения частиц (электронов) из наблюдаемой области при их попадании в зону с отрицательной энергией.
Эти парадоксальные следствия были впервые обнаружены Клейном вскоре после публикации теории релятивистского электрона. И они вызвали настороженное отношение к теории Дирака у многих известных физиков того времени. Так, В.Паули констатировал, что парадокс Клейна, согласно которому электроны могут преодолевать барьеры высотой порядка mc2 и попадать из области положительных энергий в область отрицательных энергий, выступает кардинальной трудностью теории Дирака[31].
“Состояния с отрицательной энергией, — писал Паули, — не имеют никакого физического смысла. Однако, в отличие от классической релятивистской механики, исключить состояния с отрицательной энергией для свободных электронов в квантовой теории Дирака в общем случае невозможно”[32].
Пример с историей квантово-релятивистского уравнения Дирака весьма поучителен в методологическом отношении. Этот пример показывает, что первичная теоретическая модель, которая вводится вместе с математической экстраполяцией, может оказаться неверной и поставить под угрозу даже продуктивные уравнения. Отсюда возникает важная особенность обоснования математической гипотезы. На первом этапе такого обоснования проверка уравнений данными опыта еще не позволяет заключить, пригодны или непригодны сами уравнения для описания новой области явлений. Даже тогда, когда выводы из уравнений не согласуются с опытом, не следует, что их нужно отбросить как неудачную гипотезу. Рассогласование с опытом служит лишь сигналом, что в едином образовании “уравнения плюс интерпретация” какая-то из частей не адекватна новой области явлений. Исследователь заранее не знает, какая именно часть (можно говорить о продуктивности уравнений лишь ретроспективно, зная их роль в истории физики, как, например, в случае с уравнением Дирака).
Однако, поскольку первоначальная интерпретация уравнений носит гипотетический характер, весьма вероятно, что именно она ответственна за противоречия между следствиями из уравнений и данными эксперимента. Поэтому, если обнаружено рассогласование уравнений с опытом, начинается второй этап эмпирического обоснования математической гипотезы. На этом этапе происходит изменение первоначальной интерпретации путем перестройки исходной гипотетической модели, в которой ранее выполнялись уравнения, в новую модель. Чтобы проиллюстрировать характерные особенности этого процесса, вернемся к примеру с уравнением Дирака.
После того как было обнаружено рассогласование уравнения с опытом, Дирак перестроил первоначальную его интерпретацию. Он отказался трактовать это уравнение как описание поведения одной частицы. Теоретическая модель, благодаря которой математический формализм Дирака превратился в эффективно работающий аппарат, была связана с идеей многочастичных систем. В этой модели для свободных частиц запрещалась область отрицательных энергий, несмотря на то, что наличие двух знаков для параметра энергии являлось прямым математическим следствием строгого решения уравнения. Этот запрет был получен с помощью использования принципа Паули, сформулированного, как известно, для системы электронов. Все состояния с отрицательной энергией в рамках новой интерпретации предполагались целиком заполненными электронами. Такой “квазиконтинуум” электронов, согласно принципу Паули, внешне никак не мог себя проявить, поскольку перемещение (движение) электронов внутри континуума, будучи необходимым условием его экспериментального обнаружения, предполагает изменение энергии электронов, что невозможно, поскольку все энергетические состояния уже заполнены[33]. Единственная возможность обнаружить хотя бы один экземпляр из этого континуума заключалась в переводе частицы в зону с положительной энергией, где имелись свободные уровни. Этого можно было добиться при энергетических воздействиях величиной не менее чем 2mc2 (величина энергетического барьера). Но при такого рода извлечении электрона из континуума образуется “свободное место” (дырка), которое ведет себя как состояние с положительным зарядом и положительной энергией (поскольку для того, чтобы ликвидировать это состояние, нужно, по определению, поместить туда электрон с отрицательной энергией). Данное “незаполненное состояние” уже может проявлять себя экспериментально. “Дырка” в континууме электронов может быть заполнена электроном из соседней ячейки континуума, в которую может “перескакивать” электрон из другой ячейки, и т. д. Эффективно этот процесс должен проявляться как принципиально наблюдаемое движение положительного заряда с положительной энергией. Так из самих свойств новой модели естественно следовало предсказание позитронов.
Правда, интерпретация “дырки” как позитрона тоже потребовала определенных творческих усилий. Дирак вначале ассоциировал “дырку” с протоном. Но вскоре Р.Оппенгеймер установил, что если “дырку” интерпретировать в качестве протона, то такая интерпретация сохраняет вытекавший из парадокса Клейна вывод о неустойчивости атома водорода (время жизни атома водорода оказывалось порядка 10-10 сек). Чтобы найти выход из этого противоречия, Оппенгеймер предложил рассматривать “дырки” как положительные электроны, отличные от протонов. Он же ввел термин “позитрон”[34]. Г.Вейль показал, что масса дырок должна совпадать с массой электрона. Примерно спустя три года после новой интерпретации Дираком квантово-релятивистского уравнения для электрона, в 1932 г. К.Андерсон обнаружил позитрон экспериментально.
Согласно новой интерпретации уравнения Дирака, всякая появившаяся в континууме “дырка” (позитрон) может быть уничтожена, когда в нее попадает электрон из зоны положительных энергий. Такой переход электрона должен сопровождаться выделением квантов энергии (величиной не менее 2 mc2), подобно тому как выделяется энергия при захвате свободного электрона атомом, у которого был предварительно удален электрон с одной из внутренних оболочек. Нетрудно заметить, что из свойств новой теоретической модели прямо вытекала идея аннигиляции.
Проведенная Дираком реинтерпретация своего уравнения устранила рассогласование последнего с опытом. Уравнение не только было приведено в соответствие с экспериментами, но и позволило предсказать совершенно неожиданные явления: существование позитронов и эффект аннигиляции и рождения пар.
Новая теоретическая схема, обеспечившая адекватную связь квантово-релятивистского уравнения для электрона с опытом при ее соотнесении с физической картиной мира, вводила принципиально новые представления об электромагнитных взаимодействиях. В физической картине мира появлялись новые представления об электронно-позитронном вакууме как особом состоянии физического мира, активно проявляющегося во взаимодействиях электронов, позитронов и фотонов.
Новая интерпретация уравнения Дирака, после выяснения всех деталей ее физического содержания, в довольно короткий срок была принята научным сообществом. И те физики, которые на первых порах скептически относились к теории Дирака, пересмотрели свою первоначальную оценку теории. Показательно, например, изменение позиции Паули, который, отмечая изящное использование Дираком в его новой интерпретационной схеме принципа запрета, признавал перспективы, открываемые в связи с представлениями о физическом вакууме как потенциальном генераторе рождения частиц.
В своей Нобелевской лекции, прочитанной 13 декабря 1946 г., Паули, оценивая с исторической дистанции открытие Дирака, писал: “...Ответ П.Дирака привел к тому, что могло бы на самом деле получиться при применении принципа запрета. В своем докладе, прочитанном в Стокгольме, Дирак сам рассказал о своем предложении по новому интерпретировать его теорию, согласно которой в истинном вакууме все состояния с отрицательной энергией должны быть заполненными, и наблюдаемыми следует считать только отклонения от этого состояния с минимальной энергией, а именно дырки в море этих заполненных состояний. Именно принцип запрета гарантирует устойчивость вакуума, в котором все состояния с отрицательной энергией заполнены. Кроме того, дырки обладают всеми свойствами частиц с положительной энергией и положительным зарядом, поскольку они могут рождаться и уничтожаться парами во внешних электромагнитных полях. Предсказанные таким образом позитроны, эти точные зеркальные изображения электронов, действительно были обнаружены экспериментально.
Новая интерпретация, очевидно, принципиально отказывается от точки зрения, характерной для одночастичной задачи, и с самого начала рассматривает задачу многих частиц”[35].
Разобранный пример, на наш взгляд, позволяет отметить ряд особенностей экспериментального обоснования математической гипотезы, связанных с построением новой интерпретации уравнений. В общем плане, конечно, известно, что, когда математическая гипотеза не подтверждается опытом, исследователь ищет новую интерпретацию. Но мы хотели бы обратить внимание на следующие механизмы такого поиска.
Во-первых, важно, что исходным материалом для создания новой интерпретации служат абстрактные объекты первоначально введенной модели. Когда Дирак строил новую модель, то он применял уже имевшиеся абстрактные объекты “частица”, “область положительных энергий” и “область отрицательных энергий”, подвергнув изменению только последний объект (у которого был элиминирован признак “иметь свободные энергетические уровни”).
Исследователь не просто создает новую интерпретацию на “голом месте”, а использует в качестве строительного материала абстрактные объекты, введенные ранее, в ходе самого построения математической гипотезы.
Во-вторых, важным фактором, целенаправляющим создание новой интерпретации, является требование, чтобы теоретическая модель была обоснована как идеализированная схема взаимодействий, проявляющихся в реальных экспериментальных ситуациях. Именно это заставляет исследователя перестраивать абстрактные объекты, отыскивая корреляты их признаков в реальных взаимодействиях, наблюдаемых в опыте. Уже в ходе первичной опытной проверки математических гипотез выясняется, какие из абстрактных объектов не удовлетворяют этому требованию. Это выявляет неконструктивные элементы в первоначальной интерпретации и указывает пути ее изменения. Так, отображение на экспериментальные ситуации в атомной области первоначальной модели, в которой выполнялось уравнение Дирака, показывало, что ее противоречие опыту было результатом представлений об области отрицательных энергий.
Но поскольку уравнения требовали введения такого абстрактного объекта, постольку оставался только один путь — наделить “область с отрицательными энергиями” признаками, которые бы запрещали попадание электронов в эту область. Видимо, именно отсюда и пришла правильная догадка о континууме электронов, позволившая построить продуктивную интерпретацию уравнений.
Характерно, что, вводя вместо прежней модели новую систему абстрактных объектов (континуум электронов, заполняющих все состояния с отрицательной энергией и свободные электроны в зоне положительной энергии), Дирак обосновывал эту систему как идеализированную схему экспериментально-измерительных ситуаций атомной области. Он находил основание признаков каждого из перечисленных абстрактных объектов в экспериментально наблюдаемых ситуациях. Абстрактные объекты “электрон” и “область положительной энергии” достаточно легко получали такое основание (в принципе правомерность введения таких объектов была доказана всем предшествующим развитием атомной физики) . Труднее это было сделать по отношению к “электронному континууму”. Однако и этому абстрактному объекту был найден коррелят в реальных взаимодействиях, фиксируемых экспериментами атомной области. Идея континуума появилась как результат анализа всего теоретического и экспериментального материала физики, связанного с исследованием электронных оболочек атомов. Дирак ввел континуум электронов по аналогии с заполненными оболочками атома, который также мог терять электроны на внешних оболочках. Представив такие оболочки в предельно идеализированной форме, Дирак истолковал их как своеобразную систему ферми-частиц вообще. После этого электронный континуум оказался обоснованным всеми экспериментально-измерительными ситуациями, в рамках которых исследовались многоэлектронные системы. В свою очередь, такое обоснование позволило эффективно использовать принцип запрета Паули при создании новой теоретической модели.
Итак, процесс эмпирического обоснования математической гипотезы предполагает ряд достаточно сложных процедур. Среди них можно выделить: 1) экспликацию гипотетической модели, вводимой первоначально вместе с новыми уравнениями; 2) отображение этой модели на экспериментально наблюдаемые взаимодействия природных объектов; 3) сопоставление системы “уравнение плюс модель” с данными опыта; 4) перестройку первичной модели, если получено рассогласование с опытом; 5) конструктивное обоснование новой модели; 6) новая проверка опытом системы: “уравнения плюс их новая интерпретация ”.
Лишь после всех этих операций можно судить, пригодны или непригодны уравнения, введенные методом математической гипотезы, для описания той или иной области взаимодействий. Что касается утверждения о том, что судьба гипотетически вводимых уравнений решается путем их сопоставления с опытом, то оно верно лишь при учете всех описанных особенностей эмпирического обоснования уравнений. Но понимаемое в упрощенной форме: “уравнения отбрасываются, если они не подтверждаются опытом, и сохраняются, если они совпадают с данными эксперимента” — такое утверждение может быть неверным (рассогласование с опытом на первом этапе эмпирического обоснования математической гипотезы не является основанием для отбрасывания уравнении).
Из вышеизложенного вытекает, что основные трудности создания непротиворечивой системы теоретических знаний не заканчиваются после нахождения уравнений. Более того, именно здесь и начинается самый ответственный и сложный этап работы физика-теоретика.
“Легче открыть математическую форму, необходимую для какой-нибудь основной физической теории, — писал П. Дирак, — чем ее толкование. Это потому, что число вещей, среди которых приходится выбирать, открывая формализм, очень ограничено, так как число основных идей в математике не очень велико, в то время как при физической интерпретации могут обнаружиться чрезвычайно неожиданные вещи”[36]. По-видимому, без преувеличения можно сказать, что и на современном этапе развития теоретических знаний, когда первые шаги исследования связаны с математической гипотезой, построение теоретической схемы, которая обеспечивает интерпретацию уравнений и их соотнесение с опытом, остается ключевым моментом такого исследования.
Дата добавления: 2016-04-02; просмотров: 744;