?

Log in

No account? Create an account

Entries by category: технологии

Подсыплю ложку первоклассного дёгтя.

Слышали про Сколковский/Казанско-IT-парковский проект распознавания речи при помощи, в том числе, информации о движении губ с видеокамеры?

http://realspeaker.net/ru/

Они получили 9 миллионов финансирования, etc.

Что представляет собой проект? Это программа, которая комбинирует готовые открытые библиотеки распознавания лиц из проекта OpenCV/Emgu.CV (Open Computer Vision) и готового же онлайнового гугл-сервиса по распознаванию аудио (Google Speech Recognition API — то же самое, что происходит при распознавании речи в каждом Андроиде, ровно то, что уже доступно каждому JavaScript-программисту в браузере Chrome, и ровно то, на основе чего мы с sidentdv за одну ночь на ульяновском хакатоне написали проект AudioSMS).

Как комбинирует? Берёт аудио с микрофона и по сети посылает в гугл API, пока губы движутся, и не посылает, пока губы не движутся. Эта зависимость от движения губ называется «детекцией пауз». Сервер гугла в ответ присылает в текстовом виде распознанный текст.

Почему это не прорыв? Потому что если не обладать возможностью действительно встроиться в алгоритмы распознавания аудио, нельзя сделать глубокий фидбэк видео от губ. Например, подмешать видеопоток в bayesian language model. То есть, нельзя сделать так, чтобы губы действительно влияли на качество распознавания аудио. Максимум что можно сделать — вот это самое распознавание пауз, при котором шум с микрофона не посылается в гугл.

Может быть это какое-то демо, а у них в лаборатории готовится реальный прорыв? Да, они пишут, что это прототип. Хотя и продают его Pro версию за 1000 рублей. И хочется верить, что у команды есть более тяжёлая артиллерия. Но не думаю, что это так.

Кстати, интересно что у ребят нет договора с Гуглом по коммерческому использованию их API по распознаванию речи.

Ещё интересно, что вся информация, которую я написал, доступна в интервью и в описаниях почти прямым текстом. Но когда чиновники хвалятся этим проектом, то создаётся впечатление неокосмических технологий и искусственного интеллекта, который читает прямо по губам.
Сердце Силиконовой долины. Город Санта-Клара, где размещается штаб-квартира Intel. Сравнение мобильника с LTE и домашнего DSL.

Не в пользу DSL.



Будущее уже здесь, только оно неравномерно распределено :)

ВолгаТелеком Support

Первого февраля посылаю в службу поддержки ВолгаТелекома через формочку на их сайте, рядом или в личном кабинете абонента:
Отключение по порогу месяца

Интернет отключился в 23:40 тридцать первого января. Соответственно,
пополнить счёт ночью нельзя - сайт vt.ru деньги с банковских карт не
принимает, а все салоны по пополнению интернет-счетов несколько часов
как закрыты.

Почему не сделать отключение в полдень а не в полночь? Или добавить
круглосуточную оплату по карточкам прямо на сайт.

Восемнадцатого марта получаю ответ в email:
From: Баранкова Галина <g.barankova@ul.vt.ru>
Date: 3/18/09 7:54 PM
Subject: Re: отключение по порогу

> Тема сообщения:Отключение по порогу месяца
> Текст сообщения:
> Интернет отключился в 23:40 тридцать первого января. Соответственно,
> пополнить счёт ночью нельзя - сайт vt.ru деньги с банковских карт не
> принимает, а все салоны по пополнению интернет-счетов несколько часов
> как закрыты.
>
> Почему не сделать отключение в полдень а не в полночь? Или добавить
> круглосуточную оплату по карточкам прямо на сайт.
>
>

> _______________
> Уважаемый абонент!
> У вас авансовая форма оплаты, тариф Общайся. На этом тарифе вы
> оплачиваете абонплату 350 руб + деньги за перерасход (по 0,75 коп за 1
> Мбайт). На момент обращения деньги на счету закончились, необходимо
> пополнить счет</b>.

Искусственный интеллект в действии. "Такая программа пишется на Прологе за полчаса, и отрабатываться будет меньше чем за полтора месяца", говорит oleyka.

Вопрос снят, вопросов больше не имею.

Так и написал в ответ:
To: Баранкова Галина <g.barankova@ul.vt.ru>
Date: 3/18/09 11:15 PM
Subject: Re: отключение по порогу

Спасибо, Вашим ответом удовлетворён.

http://lionet.livejournal.com/30410.html

[…]

Yay!

JS-Kit начали использовать в фирме Intel.

http://oss.intel.com/en-us/projects/

См. внизу страницы.

Tags:

Profile

lionet
Lev Walkin
Website

Latest Month

December 2016
S M T W T F S
    123
45678910
11121314151617
18192021222324
25262728293031

Syndicate

RSS Atom
Powered by LiveJournal.com
Designed by yoksel