Íslenskir sjálfboðaliðar þróa máltækni fyrir Google sunna karen sigurþórsdóttir skrifar 6. október 2015 07:45 Google hefur þróað ódýrar aðferðir sem henta vel í sjálfboðavinnu til að búa til tölvuraddir fyrir minni málsvæði, vísir/epa Google hefur fengið til liðs við sig tuttugu íslenska sjálfboðaliða sem vinna munu með fyrirtækinu að íslenskri máltækni. Sjálfboðaliðarnir munu lesa um hundrað og tuttugu þúsund íslensk orð og í kjölfarið verður ráðist í að mynda tvær raddir; karlmanns- og kvenmannsrödd. Um þrjú ár eru síðan Íslendingar gátu byrjað að tala íslensku við leitarvélina. Nú er stefnt að því að leitarvélin sjálf geti talað við fólkið. Úlfar Erlingsson er doktor í tölvunarfræði og starfar við öryggismál hjá Google. Hann heldur utan um verkefnið hér á landi. „Venjulega þegar búin er til svona tölvurödd eru fengnir alvöru leikarar, þeim er borgað og það tekur margar vikur, bara eins og talsetning fyrir bíómyndir. Sú leið svarar hins vegar ekki kostnaði fyrir sjaldgæfari tungumál. Því hefur Google þróað ódýrar aðferðir sem henta vel í sjálfboðavinnu til að búa til tölvuraddir fyrir minni málsvæði,“ segir Úlfar. „Núverandi röddin er bara algjör tölvurödd, en hinar raddirnar í svona stærri tungumálum eru orðnar rosa flottar, það er enginn mnur á þeim og venjulegri rödd.“ Stefnt er á að klára verkefnið fyrir jól. Úlfar segir að þetta komi til með að verða afar þýðingarmikið til dæmis fyrir kennslu á Íslandi, og fyrir þá sem hafa hug á að læra íslensku. „Máltæknin er fyrst og fremst þýðingarmikil ef fólk vill halda áfram að tala íslensku. Ein hugmyndin er að grunnskólar geti nýtt sér þetta, en eitt af því sem ég hef verið að vinna að er að það sé ókeypis og auðveldur aðgangur að þessu,“ segir hann. Sem fyrr segir verða sjálfboðaliðarnir tuttugu; tíu karlar og tíu konur. Hver og einn les um nokkur hundruð setningar en sett voru þau skilyrði að þeir sem lesi séu með góða, jafna og skýrmælta rödd og kunni að beita henni rétt. Tekið verður upp með sérstökum búnaði frá Google, sem kemur hingað til lands í næstu viku.Þær hættur sem steðja að íslenskri tungu á stafrænni öld voru til umfjöllunar í fréttaskýringaþættinum Brestum á Stöð 2 í fyrravetur. Hér fyrir neðan má sjá brot úr þættinum. Tengdar fréttir Ögurstund íslenskunnar Í síðustu viku vakti athygli viðtal hjá RÚV við Úlfar Erlingsson, yfirmann tölvuöryggisrannsókna hjá Google, en íslenskir starfsmenn þess fyrirtækis hafa séð til þess að íslenskan er eina litla tungumálið í heimi sem komið hefur verið fyrir í máltæknigrunni þar. 21. september 2015 07:00 Deyr íslenskan stafrænum dauða? Íslenskan er í mestri útrýmingarhættu á eftir Möltu í Evrópu. 18. nóvember 2014 16:30 Ótrúlegt hve hratt Google lærði íslensku Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. 3. september 2012 22:51 Talandi tæki ógna stöðu íslenskunnar "Vandamálið er þá að ef fyrirtæki á Íslandi vill nýta sér talgreiningu þá getur fyrirtækið ekki gert það þar sem Google á það,“ segir Hrafn Loftsson, dósent í tölvunarfræði. 17. nóvember 2014 23:58 Mest lesið Innbú Play til sölu: Gæti aflað búinu fjórtán milljóna króna Viðskipti innlent Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Viðskipti innlent Telur um dulda launahækkun skrifstofufólks að ræða Viðskipti innlent Segja falda launauppbót hjá níu af hverjum tíu stofnunum ríkisins Viðskipti innlent Nú er ekki hægt að afskrá flugvélar nema að greiða gjöldin Viðskipti innlent Eva og Guðrún nýir forstöðumenn hjá Icelandair Viðskipti innlent Ísland verði leiðandi í þróun varna og viðskipta á Norðurslóðum Viðskipti innlent Skáluðu fyrir kraftinum sem knýr samfélagið Viðskipti innlent „Það er kennitöluflakk í skilgreiningu sinni“ Viðskipti innlent Bein útsending: Er gervigreindin alvöru tækifæri fyrir Ísland? Viðskipti innlent Fleiri fréttir Skáluðu fyrir kraftinum sem knýr samfélagið Innbú Play til sölu: Gæti aflað búinu fjórtán milljóna króna Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Eva og Guðrún nýir forstöðumenn hjá Icelandair Nú er ekki hægt að afskrá flugvélar nema að greiða gjöldin Telur um dulda launahækkun skrifstofufólks að ræða Davíð Ernir til liðs við Athygli Netvís tekur við af SAFT Bein útsending: Er gervigreindin alvöru tækifæri fyrir Ísland? Ísland verði leiðandi í þróun varna og viðskipta á Norðurslóðum Segja falda launauppbót hjá níu af hverjum tíu stofnunum ríkisins „Það er kennitöluflakk í skilgreiningu sinni“ Einar rýfur þögnina: Vísar kenningum um fléttu á bug Bein útsending: Ársfundur atvinnulífsins Spá óbreyttum stýrivöxtum í næstu viku „Hef engar upplýsingar um að eitthvað óeðlilegt hafi átt sér stað“ 208 sagt upp í fimm hópuppsögnum Einn stofnenda Play og Leifur í framkvæmdastjórn Icelandair Eiríkur Orri til Ofar Samkaup eignast 38 prósenta hlut í Kjötkompaní Segir stjórnendur ætla að skilja skuldirnar eftir á Íslandi „Það verður andskoti flókið“ Kaupfélagið á bak við risaviðskipti í Iceland Seafood Múlakaffi nýtir farþegamiðstöðina yfir veturinn „Við munum gæta réttar kröfuhafa í hvívetna“ Viðkvæm staða í björgunaraðgerðum Play Europe Horfa fram á tugmilljarða samdrátt og bíða í ofvæni eftir loðnufréttum Hætti korteri eftir peppfund með Möltufólkinu Isavia gefur strandaglópum engin grið Ásgeir og Darri til Landslaga Sjá meira
Google hefur fengið til liðs við sig tuttugu íslenska sjálfboðaliða sem vinna munu með fyrirtækinu að íslenskri máltækni. Sjálfboðaliðarnir munu lesa um hundrað og tuttugu þúsund íslensk orð og í kjölfarið verður ráðist í að mynda tvær raddir; karlmanns- og kvenmannsrödd. Um þrjú ár eru síðan Íslendingar gátu byrjað að tala íslensku við leitarvélina. Nú er stefnt að því að leitarvélin sjálf geti talað við fólkið. Úlfar Erlingsson er doktor í tölvunarfræði og starfar við öryggismál hjá Google. Hann heldur utan um verkefnið hér á landi. „Venjulega þegar búin er til svona tölvurödd eru fengnir alvöru leikarar, þeim er borgað og það tekur margar vikur, bara eins og talsetning fyrir bíómyndir. Sú leið svarar hins vegar ekki kostnaði fyrir sjaldgæfari tungumál. Því hefur Google þróað ódýrar aðferðir sem henta vel í sjálfboðavinnu til að búa til tölvuraddir fyrir minni málsvæði,“ segir Úlfar. „Núverandi röddin er bara algjör tölvurödd, en hinar raddirnar í svona stærri tungumálum eru orðnar rosa flottar, það er enginn mnur á þeim og venjulegri rödd.“ Stefnt er á að klára verkefnið fyrir jól. Úlfar segir að þetta komi til með að verða afar þýðingarmikið til dæmis fyrir kennslu á Íslandi, og fyrir þá sem hafa hug á að læra íslensku. „Máltæknin er fyrst og fremst þýðingarmikil ef fólk vill halda áfram að tala íslensku. Ein hugmyndin er að grunnskólar geti nýtt sér þetta, en eitt af því sem ég hef verið að vinna að er að það sé ókeypis og auðveldur aðgangur að þessu,“ segir hann. Sem fyrr segir verða sjálfboðaliðarnir tuttugu; tíu karlar og tíu konur. Hver og einn les um nokkur hundruð setningar en sett voru þau skilyrði að þeir sem lesi séu með góða, jafna og skýrmælta rödd og kunni að beita henni rétt. Tekið verður upp með sérstökum búnaði frá Google, sem kemur hingað til lands í næstu viku.Þær hættur sem steðja að íslenskri tungu á stafrænni öld voru til umfjöllunar í fréttaskýringaþættinum Brestum á Stöð 2 í fyrravetur. Hér fyrir neðan má sjá brot úr þættinum.
Tengdar fréttir Ögurstund íslenskunnar Í síðustu viku vakti athygli viðtal hjá RÚV við Úlfar Erlingsson, yfirmann tölvuöryggisrannsókna hjá Google, en íslenskir starfsmenn þess fyrirtækis hafa séð til þess að íslenskan er eina litla tungumálið í heimi sem komið hefur verið fyrir í máltæknigrunni þar. 21. september 2015 07:00 Deyr íslenskan stafrænum dauða? Íslenskan er í mestri útrýmingarhættu á eftir Möltu í Evrópu. 18. nóvember 2014 16:30 Ótrúlegt hve hratt Google lærði íslensku Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. 3. september 2012 22:51 Talandi tæki ógna stöðu íslenskunnar "Vandamálið er þá að ef fyrirtæki á Íslandi vill nýta sér talgreiningu þá getur fyrirtækið ekki gert það þar sem Google á það,“ segir Hrafn Loftsson, dósent í tölvunarfræði. 17. nóvember 2014 23:58 Mest lesið Innbú Play til sölu: Gæti aflað búinu fjórtán milljóna króna Viðskipti innlent Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Viðskipti innlent Telur um dulda launahækkun skrifstofufólks að ræða Viðskipti innlent Segja falda launauppbót hjá níu af hverjum tíu stofnunum ríkisins Viðskipti innlent Nú er ekki hægt að afskrá flugvélar nema að greiða gjöldin Viðskipti innlent Eva og Guðrún nýir forstöðumenn hjá Icelandair Viðskipti innlent Ísland verði leiðandi í þróun varna og viðskipta á Norðurslóðum Viðskipti innlent Skáluðu fyrir kraftinum sem knýr samfélagið Viðskipti innlent „Það er kennitöluflakk í skilgreiningu sinni“ Viðskipti innlent Bein útsending: Er gervigreindin alvöru tækifæri fyrir Ísland? Viðskipti innlent Fleiri fréttir Skáluðu fyrir kraftinum sem knýr samfélagið Innbú Play til sölu: Gæti aflað búinu fjórtán milljóna króna Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Eva og Guðrún nýir forstöðumenn hjá Icelandair Nú er ekki hægt að afskrá flugvélar nema að greiða gjöldin Telur um dulda launahækkun skrifstofufólks að ræða Davíð Ernir til liðs við Athygli Netvís tekur við af SAFT Bein útsending: Er gervigreindin alvöru tækifæri fyrir Ísland? Ísland verði leiðandi í þróun varna og viðskipta á Norðurslóðum Segja falda launauppbót hjá níu af hverjum tíu stofnunum ríkisins „Það er kennitöluflakk í skilgreiningu sinni“ Einar rýfur þögnina: Vísar kenningum um fléttu á bug Bein útsending: Ársfundur atvinnulífsins Spá óbreyttum stýrivöxtum í næstu viku „Hef engar upplýsingar um að eitthvað óeðlilegt hafi átt sér stað“ 208 sagt upp í fimm hópuppsögnum Einn stofnenda Play og Leifur í framkvæmdastjórn Icelandair Eiríkur Orri til Ofar Samkaup eignast 38 prósenta hlut í Kjötkompaní Segir stjórnendur ætla að skilja skuldirnar eftir á Íslandi „Það verður andskoti flókið“ Kaupfélagið á bak við risaviðskipti í Iceland Seafood Múlakaffi nýtir farþegamiðstöðina yfir veturinn „Við munum gæta réttar kröfuhafa í hvívetna“ Viðkvæm staða í björgunaraðgerðum Play Europe Horfa fram á tugmilljarða samdrátt og bíða í ofvæni eftir loðnufréttum Hætti korteri eftir peppfund með Möltufólkinu Isavia gefur strandaglópum engin grið Ásgeir og Darri til Landslaga Sjá meira
Ögurstund íslenskunnar Í síðustu viku vakti athygli viðtal hjá RÚV við Úlfar Erlingsson, yfirmann tölvuöryggisrannsókna hjá Google, en íslenskir starfsmenn þess fyrirtækis hafa séð til þess að íslenskan er eina litla tungumálið í heimi sem komið hefur verið fyrir í máltæknigrunni þar. 21. september 2015 07:00
Deyr íslenskan stafrænum dauða? Íslenskan er í mestri útrýmingarhættu á eftir Möltu í Evrópu. 18. nóvember 2014 16:30
Ótrúlegt hve hratt Google lærði íslensku Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. 3. september 2012 22:51
Talandi tæki ógna stöðu íslenskunnar "Vandamálið er þá að ef fyrirtæki á Íslandi vill nýta sér talgreiningu þá getur fyrirtækið ekki gert það þar sem Google á það,“ segir Hrafn Loftsson, dósent í tölvunarfræði. 17. nóvember 2014 23:58
Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Viðskipti innlent
Rifjar Ímon-málið upp 17 árum seinna: „Hreint og beint ofbeldi af hálfu opinberra starfsmanna“ Viðskipti innlent