1. Новости
Заметки пользователей
19.05.2016 07:50
PDF
2242
0

Google дарит искусственный интеллект и красит ЦОД

Компания Google открыла доступ к системе искусственного интеллекта и программе для анализа текстов, а также привлекла художников для создания муралов на своих дата-центрах. 

В Google долгое время велась разработка способов распознавания человеческой речи для дальнейшей ее обработки и использования полученных данных в различных сферах человеческой деятельности. В частности, возможности такой системы могут быть востребованы для совершенствования автоматических переводчиков (такая идея уже реализована в Google-переводчике, и других сервисах компании), всевозможных органайзеров, различных интеллектуальных систем управления процессами в сфере услуг, промышленности, медицине и быту.

И поэтому Google предоставил открытый доступ к  нейронной сети  SyntaxNet и анализатору речи Parsey McParseface, который можно использовать для анализа текста на английском языке. Для того чтобы проиллюстрировать работу системы подойдет пример, показанный на рисунке:

Google дарит искусственный интеллект и красит ЦОД

Это дерево зависимостей дает возможность системе распознать, что "Алиса" (Alice) и "Боб" (Bob) - существительные, а "увидела" (saw) – глагол, который является основой предложения. Алиса при этом распознается, как предмет (nsubj), в то время как Боб - его непосредственный объект (dobj). Как и следовало ожидать, Parsey McParseface анализирует это довольно простое предложение правильно (Алиса увидела Боба), но в человеческой речи встречается множество более сложных для понимания структур, например:

Google дарит искусственный интеллект и красит ЦОД

В этом случае при "переводе" требуется учитывать контекст. В указанном примере существует, по крайней мере, два возможных варианта развития событий.  Первый соответствует правильной интерпретации, где Алиса едет в своем автомобиле по улице; а второй абсурдный вариант предполагает, что Алиса едет по улице, которая находится в ее автомобиле. 

Люди замечательно делают эту работу по борьбе со смысловой неоднозначностью, однако, для компьютеров это настоящий вызов. Поэтому Parsey McParseface построена на мощных алгоритмах машинного обучения, которые учатся анализировать языковую структуру языка на основе функциональной роли каждого слова в предложении, и отбрасывают из множества возникших вариантов самые абсурдные.

На стандартном, хорошо сформулированном тесте, состоящем из случайно выбранных из англоязычной ленты новостей предложений, Parsey McParseface восстанавливает отдельные зависимости между словами с точностью более 94%. В то же время лингвисты делают такую работу с точностью 96-97%. Это говорит о том, что программа приближается к производительности человека, но только на хорошо сформированном тексте. Фразы, взятые из всего Интернета, намного сложнее анализировать, и точность анализа данных в этом случае составляет более 90%.

В Google  утверждают, что Parsey McParseface является наиболее точной в мире подобной моделью и предлагают разработчикам использовать ее для автоматического извлечения информации, перевода и в других сферах. В ходе анализа предложения программа определяет ключевые слова, что также может быть полезно для организации работы поисковых систем. Изучить код SyntaxNet и скачать модель синтаксического анализатора Parsey McParseface можно здесь

И, если в случае с анализатором текста Google  стремится научить компьютер понимать человека, то в проекте The Data Center Mural Project компания хочет привлечь внимание человека к миру компьютеров. Идея проекта сформулирована Джои Кава (Joe Kava) из  Google Data Centers: 

"Обмен ли это фотографиями, поиск в Интернете или перевод текста на другой язык, миллиарды запросов направляются в "облако" каждый день. Но мало кто знает, вся эта информация проходит через физические места, называемые центрами обработки данных. Поскольку этих зданий, как правило, не так много, чтобы быть заметными, то люди редко узнают о невероятных технологиях и людях, которые делают так много для современной жизни.

Чтобы изменить это, в партнерстве с художниками мы создали The Data Center Mural Project, который позволит перенести во внешний мир немного магии из внутреннего мира наших ЦОД".

Google дарит искусственный интеллект и красит ЦОД

Мурал на ЦОД в Оклахоме, США

Пока проект касается четырех дата-центров, два из которых (в США и Бельгии) уже оформлены, а еще два (в Ирландии и США) находятся в стадии реализации.

Google дарит искусственный интеллект и красит ЦОД 

Мурал на ЦОД в Сен-Гилене, Бельгия

0 комментариев
Оставлять комментарии могут только авторизованные пользователи