Прецизнија претрага видео записа

Стартуп са седиштем у Бостону ЕвериЗинг је покренуо претраживач за који се нада да ће променити начин на који људи траже аудио и видео на мрежи. Раније познат као ПодЗингер, претраживач подкаста, ЕвериЗинг користи говорне системе које је развила технолошка компанија ББН који може да конвертује изговорене речи у текст који се може претраживати са тачношћу од око 80 процената. Ово је најбоље од других комерцијално доступних система, каже извршни директор ЕвериЗинг-а Том Вајлд.



Аудио сигнали: Нови видео и аудио претраживач може да конвертује аудио у текстуални транскрипт са тачношћу од 80 одсто. То је довољно добро да прикаже исечке транскрипта, усмери кориснике на место у датотеци где се појављује термин за претрагу и сумира кључне концепте.

Ова висока прецизност омогућава нове могућности претраживања, каже Вајлд, као што је могућност да се обезбеде читави транскрипти видео и аудио записа, као и могућност да се људи усмере на тачно место у датотеци где се изговори реч или фраза. Технологија ће такође омогућити компанији да обезбеди циљане огласе повезане са одређеним садржајем, у великој мери на начин на који Гоогле пружа огласе засноване на тексту веб странице.





Велики изазов [у онлајн видео и аудио запису] … је непрозирност медијског садржаја, каже Вајлд. Изузетно је тешко знати који је опсег садржаја унутар видео или аудио клипа. Проблем који желимо да решимо је, каже, могућност откривања мултимедије у оквиру Веб претраге. ЕвериЗинг то ради тако што издваја садржај мултимедијалних датотека и исписује текст како би могао да искористи предности већ постојећих алата за претрагу текста које су развили као што су Гоогле и Иахоо.

Веб експлодира мултимедијом са ИоуТубе-а, подкастовима, ТВ вестима и емисијама Националног јавног радија. Али и даље је тешко потражити Барака Обаму и пронаћи све инстанце на Интернету у којима се помиње његово име. Типично, наслови клипова и ознаке које им људи додељују не садрже довољно информација да би дали корисне резултате претраге. И то је разлог зашто неколико компанија у последњих неколико година истражује коришћење аудио садржаја као водича. На пример, видео претраживач Блинкк користи технологију за препознавање говора да претражи цео Веб у потрази за релевантним садржајем, агрегирајући га на једну локацију, као што Гоогле обједињује веб странице. (Погледајте Сурфинг ТВ на Интернету.)

гм нема волана

Пословни циљеви ЕвериЗинг-а се разликују од Блинкк-ових, каже Вајлд, и он сумња да се ова два приступа могу међусобно допуњавати. Ми се бавимо продајом садржаја, а не троловањем интернета, каже он. ЕвериЗинг (који, попут Блинкк-а, пружа портал за претрагу за веб сурфере) углавном жели да се удружи са добављачима садржаја како би њихов мултимедијални садржај био претражив. На пример, компанија жели да конвертује сав аудио и видео садржај унутар АБЦ.цом у текст који се може претраживати, додајући временске ознаке том тексту (као и постојећем тексту са натписом) тако да особа може одмах да пређе на одређену реч у цлип.



Поред тога, за разлику од тренутне Блинкк-ове технологије, ББН-ова технологија омогућава ЕвериЗингу да издвоји концепте високог нивоа који првобитно можда нису били тражени. Ако је неко тражио Барака Обаму, на пример, ЕвериЗинг би могао да понуди и друге кључне речи у клипу, као што је скуп.

Идеја о коришћењу аудио транскрипата за тражење мултимедије постоји у истраживачким лабораторијама деценијама, а основна истраживања препознавања говора датирају још раније. Велики део суштинског рада догодио се на ББН, МИТ, Универзитету Карнеги Мелон, ИБМ-у и СРИ Интернатионал. Карнеги Мелон је 1995. имао радну демонстрацију сличног система за претрагу видео записа, каже Рицхард Стерн , професор електротехнике и рачунарства на универзитету. Овај систем, тзв Информмедиа , подстакао је друга истраживања на терену, каже он, и био претеча ББН-овог модерног приступа видео анализи.

Основна технологија ЕвериЗинг-а састоји се од две основне технологије из ББН-а са седиштем у Бостону. Основни систем говора у текст, назван Библос, финансиран је са 50 милиона долара новца за истраживање на основу низа владиних грантова у протеклих пет година, каже Вајлд. Користећи пробабилистичке алгоритме машинског учења, систему је потребан један минут да претвори сваки минут аудио садржаја у текст.

Други део технологије, каже Вајлд, су алгоритми који обрађују садржај текста. ББН-ова технологија природног језика садржи огромне складишта фраза и речи за контекст, што му помаже да схвати смисао видеа. На пример, сегмент вести о здрављу може користити језик који је специфичан за медицинску област. У овом случају, систем би могао да препозна одређене нејасне речи. Разумевање значења текста је моћан алат, каже Вајлд, јер омогућава ЕвериЗингу да корисницима пружи концепте високог нивоа како би могли фино да подесе своју претрагу. И што је најважније, омогућава компанији да упари циљане огласе са правим садржајем.



Право је време за видео претраживач са овим могућностима, каже Стерн из Карнеги Мелона. Видео је много убедљивији и забавнији медиј од обичног текста, каже он, а сада је толико тога доступно на Интернету. Он додаје да је ББН-ова тачност од 80 процената заиста велики подвиг и да би требало да буде адекватна за претраживање гомила садржаја на мрежи.

Иако је технологија добра, није савршена, каже Вајлд из ЕвериЗинг-а. Тачност опада када је присутна музика у позадини и ако више људи разговара истовремено. Али за тржиште информација и вести које компанија тренутно циља, технологија би требало да понуди значајно побољшање у односу на оно што је тренутно доступно, каже он. Мислим да ћемо се за неколико година осврнути и рећи: „Наравно да садржај мултимедијалних датотека мора да се може претраживати“, каже Вајлд. Било би као да се веб странице могу претраживати само по наслову и ознаци.

сакрити

Стварне Технологије

Категорија

Унцатегоризед

Технологија

Биотехнологија

Технолошка Политика

Климатске Промене

Људи И Технологија

Силиконска Долина

Рад На Рачунару

Мит Невс Магазин

Вештачка Интелигенција

Спаце

Паметни Градови

Блоцкцхаин

Репортажа

Алумни Профил

Алумни Веза

Функција Мит Невс

1865. Године

Мој Поглед

77 Масс Аве

Упознајте Аутора

Профили У Великодушности

Виђено У Кампусу

Алумни Леттерс

Вести

Избори 2020

Витх Индек

Под Куполом

Ватрогасно Црево

Бесконачне Приче

Пандемиц Тецхнологи Пројецт

Од Председника

Насловна Прича

Фото Галерија

Рецоммендед