Как мозг может обработать так много данных

Исследователи в Технологическом институте Джорджии обнаружили, что люди могут категоризировать данные, используя меньше чем 1 процент оригинальной информации и утвердили алгоритм, чтобы объяснить человека, учащегося – метод, который также может использоваться для машинного обучения, анализа данных и компьютерного видения.«Как мы понимаем так много данных вокруг нас, такого количества различных типов, так быстро и сильно?» сказал Сэнтош Вемпэла, Выдающийся профессор Информатики в Технологическом институте штата Джорджия и одном из четырех исследователей на проекте. «На фундаментальном уровне, как люди начинают делать это? Это – вычислительная проблема».Исследователи Роза Арриэга, Майя Какмак, Дэвид Раттер и Вемпэла в Колледже Технологического института Джорджии Вычисления изученной человеческой работы в «случайном проектировании» проверяют, чтобы понять, как хорошо люди изучают объект.

Они подарили испытуемым оригинальные, абстрактные изображения и затем спросили, могли ли бы они правильно определить то же самое изображение, когда беспорядочно показано просто небольшая часть его.«Мы выдвинули гипотезу, что случайное проектирование могло быть одним способом, которым учатся люди», объясняет Arriaga, старший научный сотрудник и психолог развития. «Рассказ, предсказание было правильным. Всего 0,15 процента полных данных достаточно для людей».Затем, исследователи проверили вычислительный алгоритм, чтобы позволить машинам (очень простые нейронные сети) заканчивать те же самые тесты.

Машины выступили, а также люди, который обеспечивает новое понимание того, как люди учатся. «Мы нашли доказательства, что на самом деле человек и нейронная сеть ведут себя очень похоже», сказал Арриэга.Исследователи хотели придумать математическое определение того, на что типичные и нетипичные стимулы похожи и, от этого, предсказывают, какие данные были бы самый трудный для человека и машины, чтобы учиться. Люди и машины выступили одинаково, демонстрируя, что действительно можно предсказать, какие данные будет самым трудным изучить со временем.Результаты были недавно изданы в журнале Neural Computation (пресса MIT).

Это, как полагают, первое исследование «случайного проектирования», основного компонента теории исследователей, с испытуемыми людьми.Чтобы проверить их теорию, исследователи создали три семьи абстрактных изображений в 150 x 150 пикселях, тогда очень маленьких ”случайные эскизы» тех изображений. Испытуемым показали целое изображение в течение 10 секунд, тогда беспорядочно показанных 16 эскизов каждого.

Используя абстрактные изображения, обеспеченные, что ни у людей, ни машин не было предварительных знаний того, каковы объекты были.«Мы были удивлены тем, как близко работа была между чрезвычайно простыми нейронными сетями и людьми», сказал Вемпэла. «Дизайн нейронных сетей был вдохновлен тем, как мы думаем, что люди учатся, но это – слабое вдохновение.

Найти, что это соответствует человеческой работе, – настоящее удивление».«Эта захватывающая бумага вводит локализованное случайное проектирование, которое сжимает изображения, все еще позволяя людям и машинам отличить широкие категории», сказал Сэнджой Дасгупта, преподаватель информатики и разработки в Калифорнийском университете Сан-Диего и эксперте по машинному обучению и случайному проектированию. «Это – творческая комбинация понимания от геометрии, нервного вычисления и машинного обучения».

Хотя исследователи не могут окончательно утверждать, что человеческий мозг на самом деле участвует в случайном проектировании, результаты поддерживают понятие, что случайное проектирование – вероятное объяснение, авторы завершают. Кроме того, это предлагает очень полезную технику для машинного обучения: большие данные – огромная проблема сегодня, и случайное проектирование – один способ сделать данные управляемыми, не теряя существенное содержание, по крайней мере для основных задач, таких как классификация и принятие решения.

Алгоритмическая теория изучения на основе случайного проектирования уже была процитирована больше чем 300 раз и стала обычно используемой техникой в машинном обучении, чтобы обработать большие данные разнообразных типов.