Категории: Новости

Нобелевская премия по физике: как искусственный интеллект Хопфилда и Хинтона изменил наш мир

Если у вас отвисла челюсть при просмотре последнего видео, созданного искусственным интеллектом, ваш банковский баланс был спасен от преступников с помощью системы обнаружения мошенничества или ваш день стал немного проще, потому что вы вы можете диктовать текстовые сообщения на бегу, вам следует поблагодарить многих ученых, математиков и инженеров.

Но два имени выделяются за основополагающий вклад в технологию глубокого обучения, которая делает этот опыт возможным: физик из Принстонского университета Джон Хопфилд и ученый-компьютерщик из Университета Торонто Джеффри Хинтон.

Эти исследователи были удостоены Нобелевской премии по физике 8 октября 2024 года за новаторскую работу в области искусственных нейронных сетей.

>

Хотя искусственные нейронные сети созданы по образцу биологических нейронных сетей, работы обоих исследователей опирались на статистическую физику, отсюда и премия по физике.

Объявление о Нобелевской премииОбъявление о Нобелевской премии
Андерс Ирбек беседует с средства массовой информации во время объявления о присуждении Нобелевской премии по физике 2024 года в Стокгольме, Швеция, 8 октября 2024 года. (Джонатан Накстранд/Getty Images)

Как вычисляет нейрон

Искусственные нейронные сети обязаны своим появлением исследованиям биологических нейронов в живом мозге. В 1943 году нейрофизиолог Уоррен Маккалок и логик Уолтер Питтс предложили простую модель того, как работает нейрон.

В модели Маккалока-Питтса нейрон связан с соседними нейронами и может получать сигналы от них. Затем он может комбинировать эти сигналы для отправки сигналов другим нейронам.

Но есть одна особенность: он может по-разному взвешивать сигналы, поступающие от разных соседей. Представьте, что вы пытаетесь решить, стоит ли покупать новый пользующийся спросом телефон. Вы разговариваете со своими друзьями и спрашиваете их рекомендации.

Простая стратегия — собрать все рекомендации друзей и принять решение согласиться с тем, что говорит большинство. Например, вы спрашиваете трех друзей, Алису, Боба и Чарли, и они говорят «да», «да» и «нет» соответственно. Это приводит вас к решению купить телефон, потому что у вас есть два «да» и один «нет».

Однако некоторым друзьям вы можете доверять больше, потому что они обладают глубокими знаниями в области технических гаджетов. Поэтому вы можете принять решение придать больший вес их рекомендациям.

Например, если Чарли очень хорошо осведомлен, вы можете засчитать его «нет» три раза, и теперь ваше решение — не покупать телефон — два «ура» и три. нет.

Если вам не повезло, что у вас есть друг, которому вы полностью не доверяете в вопросах технических гаджетов, вы можете даже присвоить ему отрицательный вес. Поэтому их «да» считается «нет», а их «нет» — «ура».

Как только вы примете собственное решение о том, является ли новый телефон хорошим выбором, другие друзья смогут попросить вас дать вам рекомендацию.

Аналогично в искусственных и биологических нейронных сетях нейроны могут агрегировать сигналы от своих соседей и отправлять сигнал другим нейронам.

Эта возможность приводит к ключевому различию: существует ли цикл в сеть? Например, если сегодня я спрошу у Алисы, Боба и Чарли, а завтра Алиса попросит у меня моей рекомендации, то получится цикл: от Алисы ко мне и от меня обратно к Алисе.

В рекуррентных нейронных сетях нейроны общаются вперед и назад, а не только в одном направлении.
(Zawersh/Wikimedia, CC BY-SA)

If связи между нейронами не имеют цикла, тогда ученые-компьютерщики называют это нейронной сетью прямого распространения. Нейроны в сети прямого распространения можно расположить слоями.

Первый уровень состоит из входов. Второй уровень получает сигналы от первого уровня и так далее. Последний слой представляет собой выходные данные сети.

Однако, если в сети есть цикл, ученые-компьютерщики называют ее рекуррентной нейронной сетью, а расположение нейронов может быть более сложным, чем в нейронной сети прямого распространения. сети.

Сеть Хопфилда

Первоначальное вдохновение для создания искусственных нейронных сетей пришло из биологии, но вскоре другие области начали формировать их развитие. К ним относятся логика, математика и физика.

Физик Джон Хопфилд использовал идеи физики для изучения определенного типа рекуррентной нейронной сети, которая теперь называется сетью Хопфилда. В частности, он изучил их динамику: Что происходит с сетью с течением времени?

Такая динамика важна и при распространении информации через социальные сети. Всем известно, что мемы становятся вирусными и в социальных сетях формируются эхо-камеры. Все это коллективные явления, которые в конечном итоге возникают в результате простого обмена информацией между людьми в сети.

Хопфилд был пионером в использовании физических моделей, особенно тех, которые были разработаны для изучения магнетизма, для понимания динамики рекуррентных нейронных сетей. . Он также показал, что их динамика может придавать таким нейронным сетям форму памяти.

Машины Больцмана и обратное распространение ошибки

В 1980-х годах Джеффри Хинтон, вычислительный нейробиолог Терренс Сейновски и другие расширили идеи Хопфилда. создать новый класс моделей, названных машинами Больцмана, названных в честь физика XIX века Людвига Больцмана.

Как следует из названия, конструкция этих моделей основана на статистической физике, впервые разработанной Больцманом. p>

В отличие от сетей Хопфилда, которые могли хранить шаблоны и исправлять ошибки в шаблонах (как это делает программа проверки орфографии), машины Больцмана могли генерировать новые шаблоны, тем самым сея семена современной генеративной революции искусственного интеллекта.

Хинтон был также является частью другого прорыва, произошедшего в 1980-х годах: обратного распространения ошибки. Если вы хотите, чтобы искусственные нейронные сети выполняли интересные задачи, вам нужно каким-то образом выбрать правильные веса для связей между искусственными нейронами.

Обратное распространение ошибки — это ключевой алгоритм, который позволяет выбирать веса на основе производительности сеть в наборе обучающих данных. Однако обучение многоуровневых искусственных нейронных сетей по-прежнему было сложной задачей.

В 2000-х годах Хинтон и его коллеги умело использовали машины Больцмана для обучения многослойных сетей, сначала предварительно обучая сеть слой за слоем, а затем используя еще один алгоритм тонкой настройки поверх предварительно обученной сети для дальнейшей корректировки весов.

Многослойные сети были переименованы в глубокие сети, и началась революция глубокого обучения.

allowfullscreen =»allowfullscreen» Frameborder=»0″>
Ученый-компьютерщик объясняет машинное обучение ребенку, старшекласснику, студенту колледжа, аспиранту, а затем коллега-эксперт.

ИИ отдает должное физике

Нобелевская премия по физике показывает, как идеи физики способствовали развитию глубокого обучения. Теперь глубокое обучение начало отдавать должное физике, позволяя точно и быстро моделировать системы, начиная от молекул и материалов и заканчивая климатом всей Земли.

Присуждая Хопфилду Нобелевскую премию по физике и Хинтона, комитет премии выразил надежду на то, что человечество сможет использовать эти достижения для повышения благосостояния человека и построения устойчивого мира.

Амбудж Тевари, профессор статистики, Мичиганский университет

Эта статья переиздана из The Conversation под лицензией Creative Commons. Прочтите оригинал статьи.

Виктория Ветрова

Космос полон тайн...

Недавние Посты

Тени Луны могли содержать микробы. Вот почему это беспокойство.

Могут ли микробы выжить в постоянно тенированных регионах (PSR) Луны? Осевой наклон. Это исследование может…

03.04.2025

Звезды тоже получают черви, и «песни» могут рассказать нам свою историю

«Музыка» станородок-огромные вибрации, вызванные разрывами пузырьков газа, которые волнуют по всему телам многих звезд-могут раскрыть…

03.04.2025

Паркер -зонд повторяет щетку с солнцем в Сорвиголова

Солнечный зонд Parker's NASA повторил свои рекордсменные показатели декабря 2024 года, провалившись в рамках ожапывающего…

02.04.2025

«Городской убийца» астероидный удар по-прежнему возможным (только не с землей)

Как раз тогда, когда вы думали, что можете расслабиться о предполагаемом «городском убийце» астероида 2024…

02.04.2025

Огромный 56-мильный разбил частиц возможен, говорит CERN Report

Европа лаборатория CERN заявила в понедельник, что подробный анализ не выявил никаких технических препятствий для…

01.04.2025

Новая «полудействие», наполовину огневая фаза вещества, скрывающаяся в магните

Экзотическое состояние материи было обнаружено, скрывающимся в предыдущем экзотическом состоянии, которое обнаружилось в магнитном соединении…

01.04.2025