IT Новости

Google начнет индексировать аудиофайлы как текст?

Можно сразу оказаться на наиболее релевантных запросу частях роликаGoogle в ближайшем будущем, возможно, начнет индексировать аудиофайлы. Такой топик был накануне заведен на форуме WebmasterWorld его администратором Tedster’ом.
Такое предположение он основывает на недавнем заявлении Google о том, что он научился аутоматически транскрибировать из потока речи в текст и индексировать этот контент.

Правда, Google говорил только о видеороликах кандидатов в президенты США. Команда Google разработала технологии распознавания речи, благодаря которым автоматически транскрибировала их в текст и индексировала. Таким образом, стал возможным поиск не только по содержимому title и description видеороликов, но и по самому контенту. Причем эта технология даже позволяет не просматривать все видео, а сразу оказываться на наиболее релевантных запросу частях ролика.

Но если Google начнет применять эту технологию по отношению к аудиофайлам, MP3, любому видео и мультимедиа-контентнту, это станет настоящим козырем в руках поискового гиганта.

Распознаванием голоса Google вплотную занялся еще в апреле 2007 года, когда была запущена технология распознавания голоса по телефону Google Voice Local Search. Пользователи могли получить справочную информацию о различных локальных (по США) объектах или услугах.
Преимущество технологии в том, что пользователю не нужен компьютер и интернет, достаточно сделать бесплатный звонок на указанный Google номер и его соединят с нужными людьми или скинут SMS-сообщение с подробной информацией или даже картой местности.

Google давно уже делает шаги к улучшению возможностей индексации нетекстового контента. Так, около полугода назад компания запатентовала технологию поиска по тексту в изображениях - “Recognizing Text In Images”. Новая технология может как распознавать ключевые слова на изображении, так и выделять группы связанных слов и сопоставлять их с описанием картинки.


24.07.08 // Источник: SeoNews - Поисковые системы


Еще новости