Квантовые Нейронные Сети

Введение

Идея квантовой нейронной сети была впервые представлена в работе Kak, S. Inf. Sci. 128(1995)143. Она представляет собой объединение концепции обычной нейронной сети и парадигмы квантовых вычислений. В 1997 г. в работе А.Власова была предложена гипотетическая модель квантовой нейронной сети, использующей оптическую интерференцию. Первое систематическое рассмотрение искусственных квантовых нейронных сетей (ИКНС) было дано в диссертации Т.Меннера (Menner, T. Univ. Exeter, 1998). После этого появилось значительное число работ, обобщающих хорошо развитый аппарат классических ИНС на квантовый случай. В 2000 г. Д.Вентура и Т.Мартинец предложили квантовую реализация модели ассоциативной памяти основанную на алгоритме Гровера, а Е.Берман c соавторами -- идею физической реализации квантовой нейронной сети в виде массива квантовых точек. К настоящему времени большинство предложенных квантовых нейронных сетей представляет собой самоорганизующиеся сети, т.е. сети, работающие без учителя, весовые множители в которых определяются параметрами решаемой задачи. Что касается сетей с учителем, то в 2001 г. М.Алтайским была предложена модель квантового перцептрона. Имплементация этого алгоритма обновления весов была дана в работах Р.Чжоу с соавторами (Neural Process. Lett. 23(2006)261) Quantum perceptron network. В основу алгоритма легли кубитные нейронные сети Kouda, Matsui, Nishimura. К необучающимся сетям следует отнести нейронные сети на квантовых гейтах, а также работающие в настоящее время квантовые компьютеры компании D-wave Systems Inc.

Классические нейронные сети

Искусственная нейронная сеть (ИНС), или просто нейронная сеть, представляет собой программную или (опто-) электронную систему, обеспечивающую принятие решений путем эволюции сложной нелинейной системы, на вход которой подается вектор входных данных, а выходной сигнал кодирует принимаемое решение. Идея нейронной сети, предложенная в 40-х - 50-х годах прошлого века для объяснения принципов работы мозга (McCulloch and Pitts, 1943; Hebb, 1949), является альтернативой детерминистическим алгоритмам используемым в современных вычислительных устройствах. По сути, искусственная нейронная сеть представляет собой некий черный ящик, способный, в зависимости от своего внутреннего состояния, отображать N-мерный вектор входных данных в M-мерный вектор выходных данных. При этом внутреннее состояние нейронной сети адаптивно, т.е. изменяется в процессе обучения. Обучение сети может осуществляться с учителем, или без учителя. Обучение с учителем состоит в том, что на вход сети подается серия входных данных, для которых известен желаемый выход сети. Вектора данных последовательно подаются на вход сети, а изменение ее внутреннего состояния производится в зависимости от того, насколько близок выход сети, получаемый для данного вектора, к желаемому. Сеть обучена, когда для всех векторов из исходного обучающего набора выход сети достаточно близок к желаемому. Обученная сеть может быть использована для обработки новых входных данных. При обучении без учителя достаточно иметь только вектора входных данных: изменение состояния сети происходит по принципам самоорганизации, и зависит от корреляций, имеющихся между векторами. Использование нейронных сетей эффективно в тех задачах, в которых размерность результата достаточно низка, в то время как сам процесс вычисления является ресурсоемким по времени и/или памяти. Простейшим элементом нейронных сетей является нейрон -- преобразователь суммарного входного сигнала в выходной с использованием нелинейной переходной функции. Сеть представляет собой нелинейный параллельный процессор, основанный, в общем случае, на связи всех нейронов со всеми. В процессе обучения нейронной сети изменяются интенсивности связей (весов) соединяющих различные нейроны. В результате обучения существенно отличными от нуля остаются лишь те связи, которые приводят к правильным ответам для предъявленного множества обучающих векторов. Для искусственных нейронных сетей наличие множества связей является и достоинством, и недостатком. С одной стороны, когда сеть обучена, наличие сложной конфигурации весов позволяет решать сложные нелинейные задачи за время, ограниченное лишь скоростью распространения сигнала в сети, в частности, многопараметрические задачи классификации. С другой стороны, при добавлении к обучающему множеству новых элементов, как правило, требуется переобучение всей сети, что связано с большими затратами времени на пересчет всех весовых множителей. Очевидно, что в реальных биологических системах, моделью которых является нейронная сеть, последовательное переобучение всей сети вряд ли происходит. Это заставляет искать более эффективные альтернативы традиционной модели ИНС. Одной из таких альтернатив являются квантовые нейронные сети, эффективность которых качественно возрастает за счет квантового параллелизма.

Существуют различные определения нейронной сети. Так, согласно (Haykin,1999), нейронная сеть представляет собой существенно параллельную распределенную систему обработки информации, состоящую из простых идентичных блоков, нейронов, обладающую способностью хранить информацию и предоставлять ее для использования.

Работа нейронной сети аналогична работе мозга в двух следующих аспектах:

  1. Знание, приобретается нейронной сетью посредством процесса обучения.
  2. Для хранения полученных знаний используется интенсивность межнейронных связей, синаптических весов.

Математическая модель нейрона

Биологический нейрон - специальное клеточное образование микрометрового масштаба, форма и размеры которого варьируются в очень широких пределах, - представляет собой элементарный блок, из которых строится нейронная сеть мозга. Мозг человека содержит порядка 8.6*1010 нейронов. Биологический нейрон состоит из тела нейрона, входных каналов - рецептивных зон, или дендритов, и выходного канала - аксона, оканчивающегося синаптическими терминалами, связывающими выход данного нейрона с входами других нейронов.

МакКаллош и Питс (1943) предложили следующую математическую модель нейрона. Входные сигналы xj поступающие на вход нейрона k суммируются с различными весами, а результат суммирования сдвигается на постоянную величину bk, зависящую от номера нейрона:

Получающаяся таким образом величина uk называется активационным потенциалом нейрона.

Математическая модель нейрона

Выходной сигнал нейрона, выдаваемый в аксон, определяется нелинейной сигмоидной функцией f(u) так, что величина сигнала на выходе определяется выражением y=f(u) Блок-схема классической модели нейрона приведена на Рис.1. Активационная функция часто формализуется в виде ступенчатой функции ,

гиперболического тангенса f(u)=tanh(au),

логистической функции f(u) = (1+exp(-au))-1, или других аналогичных функций.

В реальном биологическом нейроне кодирование выходного сигнала осуществляется по частоте, в ИНС же под f(u) понимают амплитуду сигнала. Аксон каждого нейрона имеет многочисленные ответвления - синаптические терминалы, - с помощью которых выходной сигнал одного нейрона может быть подан на входы многих других нейронов. Так образуется нейронная сеть. С математической точки зрения такая сеть представляет собой ориентированный граф. Если набор весов wkj задан, то подача входного сигнала на N входов нейронной сети однозначно определяет выходной сигнал на M ее выходов. Настройку весов wkj, так чтобы выход сети был максимально близок к желаемому для всех входных данных называют обучением сети.

Задачи решаемые нейронными сетями

Искусственные нейронные сети являются очень сильно упрощенной моделью мозга, поэтому их использование эффективно, по сравнению с использованием алгоритмического компьютера, в тех задачах, в которых размер входных данных и время вычислений, необходимое алгоритмическому компьютеру, велики, а размерность результата не велика. В этом случае, в результате обучения нейронной сети строится отображение пространства входных данных на пространство выходных данных.

К таким задачам относятся:

Нейронные сети широко применяются в системах автоматического мониторинга сложных технических объектов, в робототехнике, для автоматизации биржевых операций, в ядерной физике, в геофизических исследованиях и медицине.

Типы нейронных сетей

Обучение классических ИНС основано на аналогии с биологическими нейронными сетями, состоящими из нервных клеток -- нейронов. Первая математическая модель таких сетей была основана на правиле Хебба, заметившего, что связь между двумя нейронами усиливается если они активируются в один и тот же момент времени. Этому соответствует изменение межнейронных связей (весов) по правилу:

Δ wij = η yj yi,

где yi выходной сигнал i-го нейрона, yj - его входной сигнал, 0 < η < 1 коэффициент обучения.

В искусственных нейронных сетях возникает две возможности обучения: обучение без учителя и обучение с учителем. В первом случае работает упомянутое выше правило Хебба. Во втором случае, вместо выходного сигнала i-го нейрона используется желаемый выходной сигнал di (desired):

Δ wij = η yjdi

Обучение сети происходит потактно:

wij(t+1) = wij(t) + Δ wij,

т.е. веса изменяются в дискретные моменты времени.

Каждый нейрон представляет собой нелинейный сумматор входных сигналов. ИНС, как правило, состоят из отдельных слоев нейронов, так что выходы нейронов предыдущего слоя соединены с входами нейронов следующего слоя xin+1 = yin, n =0,1,2,... . Таким образом k-слойная ИНС представляет собой сложную нелинейную функцию, отображающую N-мерный вектор входных данных в M-мерный вектор выходных данных. Параметрами этого отображения являются межнейронные веса wnij.

На Рис.2 приведен пример прямоточной нейронной сети типа перцептрон, содержащей один скрытый слой. В данном случае N=7,M=2. Когда обучение происходит с учителем, т.е. для каждого предъявляемого входного вектора из обучающей выборки известен желаемый вектор выходных значений, значения весов могут быть найдены путем минимизации по параметрам wnij среднеквадратичной ошибки

получаемой в выходном слое нейронной сети, с помощью различных численных методов, чаще всего с помощью различных модификаций метода градиентного спуска. Усреднение < > производится по всем предъявленным векторам обучающей выборки.

Квантовые нейронные сети

Парадигма квантовых вычислений

Классический компьютер работает с регистрами битов -- физических систем, которые могут находиться в одном из двух взаимоисключающих состояний, обозначаемых для определенности 0 и 1. Физическая реализация этих состояний обычно подразумевает наличие или отсутствие тока в электронном устройстве. Регистр состоящий из n бит имеет 2n различных состояний.

Миниатюризация элементной базы вычислительных устройств привела к тому, что физическая система, содержащая один бит информации, имеет нанометровые размеры и уже не может быть описана классически. Для ее описания необходимо привлекать законы квантовой механики. Это означает, что система может находиться в состояниях 0 и 1, с ненулевыми, но отличными от единицы вероятностями. Для строгого описания таких устройств следует учесть, посредством матрицы плотности, их взаимодействие с флуктуирующим окружением. Однако существует теоретическая абстракция, напрямую позволяющая расширить классическую теорию информации до теории квантовой информации. Эта абстракция состоит в том, что каждый бит может находиться в чистом состоянии - квантовой суперпозиции двух классически несовместимых состояний 0 и 1:

Величины |c0|2 и |c1|2 определяют вероятность того, что в результате измерения, проведенного над квантовым битом, будет получено состояние, 0 или 1, соответственно. Такую систему называют квантовым битом, или кубитом. Физической реализацией кубита может быть фермион со спином 1/2, двухуровневый атом, кольцевой ток в устройстве SQUID, или другая квантовая система для которой допустима суперпозиция двух различных состояний. При этом существенным преимуществом спиновых кубитов является минимальное взаимодействие спина с окружением, что обеспечивает большое время декогерентности (Nielsen-Chuang:2000,Stolze-Suter:2008).

Комплексность коэффициентов c0,c1 приводит к тому, что количество информации, содержащееся в одном кубите, в континуальное число раз превосходит количество информации, содержащееся в одном классическом бите. Последнее не означает, что квантовый бит содержит бесконечное количество информации: после окончания вычислений считывания информации производится путем процедуры измерения, в результате которого происходит редукция квантовой суперпозиции до одного из двух состояний, так что на выходе получается один бит информации. Регистр из n кубитов как бы содержит одновременно все возможные 2n состояния классического регистра. Основным преимуществом квантовых вычислений перед классическими вычислениями являются квантовый параллелизм, позволяющий работать со всеми допустимыми состояниями одновременно. Это позволяет решать задачи экспоненциально сложные для классического компьютера за полиномиальное время. Критическим параметром для построения квантовых вычислительных устройств является время декогеренции, т.е. время в течении которого может сохраняться когерентная суперпозиция квантовых состояний.

Декогеренция - разрушение квантовой суперпозиции - происходит вследствие взаимодействия с окружением. По этой причине существующие квантовые вычислительные устройства работают при низких температурах, позволяющих сохранить когерентную суперпозицию на время, необходимое для проведение вычислений. Сам процесс квантовых вычислений является унитарным, и следовательно, обратимым. Необратимость, связанная с разрушением когерентной суперпозиции, происходит в момент вывода результата в классический канал путем проведения измерения над квантовым вычислительным устройством.

Квантовые нейронные сети с учителем

Идея создания искусственной квантовой нейронной сети, впервые предложенная в работе [S.Kak, Inf. Sci. 83(1995)143], состоит в замене классических сигналов, поступающих на вход нейрона, на квантовые состояния, обладающие амплитудой и фазой. В этом смысле, т.е. без учета нелинейных эффектов, квантовые нейронные сети идентичны оптическим нейронным сетям [I. Shariv and A. Friesem. Opt.Lett.10(1989)485]. При этом на выходе нейрона также должно формироваться квантовое состояние, зависящее от линейной суперпозиции входящих состояний. Веса, в случае квантовой нейронной сети являются комплексными числами (которые изменяются в процессе обучения сети), так что каждое входное квантовое состояние не только взвешивается по амплитуде, но и сдвигается по фазе. Использование квантовых состояний для описания работы нейрона уже само по себе биологически мотивировано: процесс возбуждения биологического нейрона непосредственно связан с квантовым туннелированием ионов внутрь нейрона [F.Beck and J.Eccles. PNAS89(1992)11357].

Использование фазы сигнала в нейросетевых моделях является красивой математической находкой, и связано с обобщением метода обратного распространения ошибки, используемого для обучения обычного классического перцептрона, на нейронные сети с комплексными весовыми коэффициентами [T.Nitta.Neural Networks10(1997)1397]. Тем не менее, фазовый множитель может влиять и на вероятность подбарьерного туннелирования ионов в некоторых моделях биологических нейронов [M.Altaisky and V.S.H.Rao. Nonlinear Analysis B10(2009)2961]

Следует отметить, что идея того, что именно фазовые соотношения между квантовомеханическими волновыми функциями отдельных элементов нервных волокон лежат в основе работы мозга человека была впервые высказана в работах [В.Чавчанидзе. Сообщения АН ГССР59(1970)37], задолго до появления самой концепции квантовых вычислений.

В отсутствие взаимодействия с окружением, отличие квантовой модели нейрона от классической состоит в отсутствии нелинейной сигмоидной функции на выходе нейрона. В силу линейности квантовой механики, линейная суперпозиция входных сигналов может быть подвергнута лишь линейному преобразованию:

Строго говоря, дело обстоит более сложным образом: появление конкретного выходного состояния связано не только с унитарной эволюцией внутри сети, но и с актом измерения, в результате которого происходит редукция квантовой суперпозиции состояний к одному конкретному состоянию. В общем случае следует также принять во внимание неконтролируемое взаимодействие с флуктуирующим окружением. Без процессов приготовления / измерения состояний и процесса воздействия окружения на весовые множители нарушения унитарности в квантовой сети с учителем невозможно. Нелинейность же вызывается именно этими процессами. По этой причине квантовые нейронные сети часто называют квантово-инспирированными сетями [T.Menneer and A.Narayanan in NIPS'95] - это отличает их от сетей Дейча, представляющих собой потоковые графы квантовых гейтов [D.Deutch Proc. Roy. Soc. Lond.A425(1989)73].

Рассмотрим процесс обучения нейронный сети, состоящей из одного квантового нейрона, изображенного на Рис.3: Пусть фиксирован нейрон с номером k=1. Предположим также, что отсутствует модификация выходного сигнала (F=1). Тогда при подаче на n входов нейрона вектора, {|xj>}0<j≤n, состоящего из n квантовых состояний, на выходе нейрона в дискретный момент времени t формируется состояние

По аналогии с классическим перцептроном, используем для обучения квантового нейрона сигнал ошибки равен где - желаемое выходное состояние для входного вектора x. Тогда, изменение весов к следующей (t+1) эпохе обучения, согласно правилу Видроу-Хоффа, составит М.Алтайский, 2001, arxiv.org/quant-ph/0107012 :

Если скорость обучения достаточно мала 0 < η < 1/n, данное правило обучения приводит к сходимости выходного состояния к желаемому результату

Входящие состояния предполагаются нормированными <xj | xj> = 1

Процесс обучения квантового нейрона сводится к следующей последовательности операций:

  1. Задается обучающая выборка из M векторов |x(j)> и соответствующих им состояний вектора желаемого результата |d(j)> j=1...M
  2. .
  3. Случайным образом генерируются матрицы весов wk.
  4. Проводится цикл обучения
    for j = 1 to M do
    	for t = 0 to Tmax do
    		получение выходного состояния		 
    		y(t) = F sum_k w_k(t) | x_k>
    
    		вычисление ошибки для каждого из векторов обучающей выборки		
    		|e(t)> = |y(t)> - |d>
    		
    		коррекция весов 		
    		w_k(t+1) = w_k(t) + eta * |e(t)><x_k|
    	end do
    	переход к следующему вектору обучающей выборки
    end do
    
К сожалению, в силу линейности оператора F сама по себе данная схема не является эффективной. Для обучения квантового перцептрона приходится использовать ее модификации, включающие модель измерительной процедуры. Простейшая модель такого типа была предложена в работе [R.Zhou et al. Proc. ICANN2006]. Модель основана на так называемой кубитовой нейронной сети.

Кубитные сети

Кубитная сеть, предложенная в работе [Kouda,Matsui,Nishimura,Peper.Neural Comput. Appl.14(2005)114] , связана с ограничением кубита, представляемого на сфере Блоха полярным и азимутальным углам (θ,φ), на экваториальную плоскость

Нейрон кубитной сети представляет собой сумматор комплексных чисел zk = ei xkπ/2, где 0 ≤ xk ≤ 1 входные сигналы нейрона. Роль весов в сумме выполняют фазовые множители, настраиваемые в процессе обучения

Нелинейность отклика нейрона на линейную суперпозицию входных сигналов вводится посредством выделения фазового множителя из комплексной амплитуды u

где весовой множитель σ, как и фазовые множители θk и λ генерируются случайным образом перед началом обучения. Вещественная фаза y используется для генерации одного из двух возможных квантовых состояний на выходе нейрона. В соответствии со значением y, с вероятностью cos2y генерируется состояние 0, а с вероятностью sin2y - состояние 1.

Блок-схема обучения квантового нейрона приведена на Рис.4:

Обучение кубитной сети может производиться обычными методами, применяемыми для классических нейронных сетей. Так, обучение отдельного нейрона может производиться методом минимизации среднеквадратичной ошибки на обучающей выборке

где zk - генерируемое выходное значение для k-го вектора обучающей выборки, а dk - желаемое выходное значение. Минимизация может проводиться, например, методом градиентного спуска

Квантовый отжиг

Метод квантового отжига является аналогом метода классического отжига (simulated annealing), используемого для решения сложных задач оптимизации. Отличие квантового отжига от классического состоит в том, что вместо тепловых флуктуаций используются квантовые флуктуации.

В методе классического отжига для преодоления потенциального барьера высотой U, отделяющего друг от друга локальные минимумы энергии, см. рисунок, должна обладать энергией не меньшей U. Если динамика системы определяется тепловыми флуктуациями, то скорость перехода через потенциальные барьеры, отделяющие друг от друга локальные минимумы, определяется больцмановским фактором e-U/kBT, где U - высота барьера. Если U адиабатически растет со временем, или, соответственно, падает температура, как это имеет место в обычном методе отжига, то процесс фактически прекращается при U(tfreeze) ≈ kBT. Если предположить, что задача поиска основного состояния может аналогичным образом решаться за счет квантовых флуктуаций, то вероятность прохождения барьера будет зависеть не только от его высоты, но и от ширины L, т.е. вероятность туннелирования пропорциональна e-L U1/2, где Г называют константой квантового отжига. Это означает, что метод квантового отжига эффективнее классического при наличии высоких, но узких барьеров. Если динамика определяется процессами квантового туннелирования, то скорость перехода зависит лишь от величины барьера, но не зависит от температуры. Таким образом, адиабатически увеличивая высоту барьера линейно со временем, можно определить, зависит ли от температуры точка замерзания tfreeze.

Пусть исходная квантовая система представляет собой сеть Хопфильда, описываемую гамильтонианом

Для того, чтобы система кубитов эволюционировала в квантовое состояние, отвечающее минимуму гамильтониана Hp, строят вспомогательный зависящий от времени гамильтониан

так, что в начальный момент времени (t=0,Γ(0)=1, Λ(0)=0) все спины выстраиваются вдоль оси x. Далее величина Γ(t) непрерывно снижается, а величина Λ(t) возрастает до единичного значения. Процесс происходит адиабатически, так что система все время остается в состоянии с минимальной энергией.

В реальном эксперименте (M.Johnson et al. Nature 473(2011)194) измерялся отклик системы на кототкие импульсные изменения магнитного поля hi= hi(t) при медленно меняющихся параметрах Γ и Λ. Если поле h(t) не успели включить до момента, когда высота барьера U уже достаточно велика, то состояния спин-вверх и спин-вниз будут встречаться с равной вероятностью, если же успели, то вероятности будут отличаться.

Моделирование самоорганизующихся систем уравнением Шрёдингера

Континуальная модель нейронной сети привлекательна в тех случаях, когда и число нейронов и число связей между ними достаточно велики, так что вместо номера нейрона можно использовать его координаты. Весовые множители при этом определяют корреляции между функциями поля в различных точках, т.е. корреляции между нейронами. Такая модель, например, может быть использована для описания поведения толпы, когда поведение каждого индивида определяется как его локальным окружением, так и историей персонального обучения [Ivancevic, V. and Reid, D. Int. J. Def. Supp. Sys. 2(2009)269; Nonlinear Dynamics 68(2012)285].

Нелинейное уравнение Шредингера привлекательно для описания динамики мозга как такового [В.Чавчанидзе. Сообщения АН ГССР59(1970)37; G.Vitiello, Int. J. Mod. Phys. B 9(1995)973]. Действительно, нейронов мозга человека составляет величину порядка 86 миллиардов, так что при характерном размере порядка нескольких сантиметров можно считать, что каждый нейрон находится в эффективном поле других нейронов, а динамика его возбуждения определяется процессами квантового туннелирования [F.Beck and J.Eccles. PNAS 89(1992)11357]. Непосредственный толчок к использованию нелинейного уравнения Шредингера для описания реальной нейронной сети дала работа [L.Behera,I.Kar and A.Elitzur. Found. Phys. Lett. 18(2005)357], представившая модель коллективного отклика нейронов зрительной коры головного мозга на движение видимого объекта.

В наиболее общем виде построение континуальной нейронной сети на основе нелинейного уравнения Шредингера состоит в следующем. Предположим, что в одной и той же области пространства M ⊂ Rd действуют n видов различных агентов, поведение которых описывается волновыми функциями ψ(x); так, что плотность вероятности появления агента типа i в окрестности точки xM есть |ψ(x)|2. В терминах теории игр i ∈ {RED, BLUE,...,n}, так что при n = 2 имеем игру между красными и голубыми. Взаимодействие всех видов агентов между собой описывается системой нелинейных уравнений Шредингера.

где в существующих моделях

D[ψ] зависящий от амплитуды ψ коэффициент диффузии. С каждым видом агентов, связана его игровая память ωi, подчиняющаяся правилу обучения Хебба.

где

набор базисных гауссианов, центрированных вокруг центра масс распределения агента i-го типа

Дифференциальные уравнения, описывающие динамику такой системы имеют вид:

Бинарные модели этого типа, описывают конкуренцию между двумя видами агентов в борьбе за какую-либо территорию, по смыслу напоминают уравнения типа жертва-хищник. Ниже мы приводим результаты моделирования бинарной системы, проведенное по явной разностной схеме с нулевыми граничными условиями в области [0, 2π] × [0, 2π] при следующих значениях параметров

αB = αR = 0.1, CH = 0.05

на решетке Nx = Ny = 128 c шагом интегрирования по времени τ = 0.001. Начальные веса ωi(0) выбирались случайным образом в интервале [0, 1)

Поскольку система имеет вид уравнений Гросса-Питаевского, в описываемой этими уравнениями динамической системе, например динамике рассеяния толпы, можно ожидать эффектов фазового перехода типа бозе-эйнштейновской конденсации. Это характерно при описании поведения толпы при различных катастрофах. Наряду с этим система нелинейных уравнений Шредингера может иметь различные солитоно-подобные решения.

На приведенном рисунке видно, как эволюционирует начальная конфигурация из двух перекрывающихся гауссианов. За счет потенциала взаимодействия происходит эффект туннелирования волновой функции агента, в область максимальной концентрации его партнера. Поскольку ψi представляет собой волновую функцию, модуль квадрата которой описывает распределение популяции агентов, то эффект туннелирования в такой системе представляет собой некий способ самоорганизации, направленный на получение превосходства. Конечное распределение агентов в такой ситуации зависит к от случайных начальных весов ωi, выбранных при обучении, так и от граничных условий и начальной формы распределения. В силу нелинейности модели такого типа могут испытывать стохастическое поведение. Для моделирования динамики коллектива агентов, подчиняющихся системе уравнений следует провести провести усреднение по различным историям обучения.

Квантовые нейронные сети на квантовых точках

Квантовые точки (КТ) это гигантские (до 10-5см) искуственные атомы, выполненные из плупроводникового или иного материала. Свойства квантовых точек существенно отличаются от свойств окружающего однородного материала за счет почти точечной локализации электронной плотности. Квантовые точки являются элементарными строительными блоками для нано- и оптоэлектроники, на их основе изготавливают лазеры, волноводы, детекторы электромагнитного излучения, источники одиночных фотонов.

Идея использования квантовых точек в качестве элементов квантовой нейронной сети была впервые предложена в работе (E.Behrman et. al. Inf. Sci. 128(2000)257). Предложенная модель состоит в использовании квантовых состояний одномерного массива, элементами которого являются "молекулы" из пяти квантовых точек, в качестве слоя нейронной сети. При этом каждому слою нейронной сети соответствует состояние всего массива в дискретный момент времени, см. рисунок. Построенная таким образом виртуальная сеть содержит столько слоев, сколько предусмотрено дискретных моментов времени за время функционирования сети. (Фактически, число слоев такой сети есть число мягких измерений.)

Каждый нейрон-кубит представляет собой планарную молекулу из пяти квантовых точек с двумя избыточными общими электронами. Основное состояние такой молекулы двухкратно вырождено - имеются две ортогональные друг другу поляризации электронной плотности, обусловленные кулоновским отталкиванием избыточных электронов. Нелинейность в данной сети возникает из-за взаимодействия электронов КТ с фононами подложки из арсенида галия, или другого материала, на которой выполнен весь массив квантовых точек.

Данная модель, по-видимому, несмотря на свою элегантность, мало пригодна к практическому использованию, поскольку управление нелинейностью сети возможно лишь существенно нелокальным образом - посредством изменения спектра фононов, коллективных возбуждений подложки. Сам этот спектр также неустойчив по отношению к внешним тепловым флуктуациям. Для изменения электронного состояния отдельных нейронов в такой сети можно использовать локальное электрическое поле, однако, управляя спектром фононов лишь глобально, нельзя локально изменять веса, суть функции Грина, связывающие состояния нейронов в различные моменты времени. Более перспективным направлением, по нашему мнению, является создание искусственных нейронных сетей в виде двумерных массивов квантовых точек, работающих по принципу сети Хопфилда - спинового стекла. Роль спин-спинового взаимодействия в такой сети может играть диполь-дипольное взаимодействие между квантовыми точками, изменяемое путем локального изменения плотности носителей заряда в подложке. Этого можно добиться например путем возбуждения поверхностных плазмонов.

Перспективы

Программы С++

Контакты

E-mail: admin@qann.ru

Спонсоры

Исследования проводятся при поддержке Российского фонда фундаментальных исследований (грант РФФИ 13-07-00409)