Задолго до появления ChatGPT существовал проект Google Brain — исследование искусственного интеллекта (ИИ) на основе механизмов глубокого обучения. Он был запущен силами нескольких энтузиастов, которым хотелось выяснить, как при помощи ИИ можно улучшить человеческую жизнь. Во главе Google Brain встали трое визионеров: двое сотрудников Google Грег Коррадо и Джефф Дин, а также профессор Стэнфордского университета Эндрю Ын — специалист в области больших данных (биг дата), аналитик и робототехник.
Всем интересно, какой путь прошли аналитики данных, имена которых первыми всплывают в поисковой выдаче при поиске таких словосочетаний как «биг дата», «искусственный интеллект» или «машинное обучение». Эндрю Ын (Andrew Ng) однозначно стал одной из ключевых фигур в мире аналитики данных — и в мире искусственного интеллекта, который теперь, с расцветом нейросетей, неразрывно с ними связан.
Если вы здесь, то наверняка хотя бы немного интересуетесь профессией аналитика данных. Предлагаем пойти чуть дальше и записаться на бесплатный практикум «Профессия аналитик данных в эпоху ChatGPT», на котором вы сможете посмотреть, как эта профессия выглядит изнутри.
Кто такой Эндрю Ын
Имя «Эндрю Ын» слышал, пожалуй, любой интересующийся большими данными человек. Доктор Ын — признанный лидер в области искусственного интеллекта (ИИ), основатель DeepLearning.AI, генеральный директор Landing AI, генеральный партнер AI Fund, а также адъюнкт-профессор факультета компьютерных наук Стэнфордского университета. Еще он искренне верит в то, что знания должны быть доступны каждому, поэтому один из его проектов — онлайн-академия Coursera. Если вы интересуетесь обучением, то наверняка слышали и про нее.
Но что за человек стоит за всеми этими титулами?
Эндрю Ын родился в 1976 году в Великобритании. Его родители — иммигранты из Гонконга. В детстве мальчику довелось пожить не только в стране своего рождения, но также в Гонконге и Сингапуре. Однако многочисленные переезды никак не повлияли на его академические успехи: в 1997 году он получил степень бакалавра с тройной специализацией по информатике, статистике и экономике в Университете Карнеги-Меллон в Питтсбурге, штат Пенсильвания. Примерно тогда началось его увлечение большими данными и машинным обучением — несколько лет он проводил исследования в AT&T Bell Labs.
В 1998 году Ын получил степень магистра электротехники и вычислительной техники в Массачусетском технологическом институте (MIT) в Кембридже, штат Массачусетс. Именно там он создал первый общедоступный, автоматически индексируемый поисковый механизм для научных работ в интернете, который специализировался на машинном обучении.
В 2002 году он получил степень доктора философии в области компьютерных наук в Калифорнийском университете в Беркли под руководством Майкла И. Джордана — не того, который баскетболист, а специалиста по машинному обучению, статистике и искусственному интеллекту.
В Стэнфордском университете Эднрю Ын начал работать в 2002 году, поднявшись по карьерной лестнице с помощника профессора до доцента, а через 10 лет возглавил разработку основной платформы Стэнфордского университета для массовых открытых онлайн-курсов (MOOC). Его собственные лекции по машинному обучению пользовались бешеной популярностью — именно это и побудило его стать сооснователем компании Coursera.
Главные проекты
Доктор Ын — автор и соавтор более 200 научных работ в области машинного обучения, робототехники, анализа данных. В 2023 году он вошел в список Time100 AI — перечень самых влиятельных специалистов в области ИИ в мире. Причем, казалось бы, какая связь существует между искусственным интеллектом и анализом данных? Самая непосредственная — дата-сайенс служит важнейшим фундаментом для ИИ. Используя передовой статистический анализ и алгоритмы машинного обучения, аналитики данных могут выявлять закономерности, строить прогностические модели и генерировать выводы из массивов информации. И Эндрю Ын как никто другой это понимает — именно поэтому его работа, связанная в первую очередь с данными, так же тесно переплетена с нейросетями.
Самый значимый его вклад в науку связан, как ни странно, с главными любимцами интернета — котиками. Речь идет о знаменитом «кошачьем результате», когда нейросеть научилась определять кошек на YouTube без подсказки, что именно нужно там искать. В течение трех дней системе показывали 10 миллионов случайно выбранных миниатюр видеороликов на YouTube, после чего ей вручили список из 20 000 различных предметов. Вместо того, чтобы искать людей или смысл жизни, она начала распознавать изображения кошек. И это несмотря на то, что ей не было предоставлено никакой информации об отличительных признаках, которые могли бы помочь опознать животное.
На фоне современных нейросетей результат выглядит незначительно, но во-первых, это произошло в 2012 году, а во-вторых, позволило исследователям в приступить к разработке программ для распознавания речи и изображений, а также переводческих сервисов. Результаты исследования показали, что работа нейросети очень похожа на теорию «бабушкиных нейронов», согласно которой определенные нейроны человека запрограммированы на идентификацию значимых объектов. Именно так мы, люди, учимся определять слова и объекты — и нейросеть в исследовании Эднрю Ына и его коллег показала, что искусственный интеллект в этом смысле недалеко ушел от естественного.
Другой значимый вклад доктора Ына в мир биг дата, анализа данных и машинного обучения — его популяризаторская работа, начиная от MOOC и заканчивая проектом Coursera. Именно так сотни тысяч людей смогли прикоснуться к миру искусственного интеллекта и анализа данных — и именно Эндрю Ыну они обязаны такой возможности.
Великий популяризатор науки
Доктор Ын много пишет о популяризации науки — как в своем блоге, так и в виде колонок в других изданиях. Например, у него есть цикл статей, посвященных построению связанной с аналитикой и ИИ карьеры.
Вот что он советует начинающим аналитикам данных и тем, кто хочет начать изучение области ИИ:
- учиться для получения технических и других навыков;
- работать над проектами для углубления навыков и создания портфолио;
- непосредственно искать работу.
«Вначале, — пишет в колонке доктор Ын, — вы сосредотачиваетесь на приобретении базовых технических навыков. Получив базовые навыки, вы переходите к проектной работе. В этот период вы, вероятно, будете продолжать учиться. Позже вы можете время от времени заниматься поиском работы».
Какие именно навыки имеет в виду Эндрю Ын? Это Python, базы данных SQL, работа с электронными таблицами, статистика, BI-системы. Еще аналитик должен быть усидчивым, внимательным, наблюдательным и способным к обработке больших объемов данных. И готовым подключить к своей работе ИИ, потому что, как показывает опыт доктора Ына и других аналитиков, это сильно упростит работу и позволит развиваться в перспективных областях.
На бесплатном практикуме «Профессия аналитик данных в эпоху ChatGPT» мы подробно об этом рассказываем, так что присоединяйтесь, пока есть места!