Tekoälyuutiset: Tekoälymalli, joka osaa lukea puhelimen näyttöä

Viikottainen tekoälyartikkeli summaa viikon tärkeimmät tekoälyuutiset maailmalta.

Antti Lähtevänoja
Antti Lähtevänoja

Viikottainen tekoälyartikkeli summaa viikon tärkeimmät tekoälyuutiset maailmalta.

Kuva luotu Dalle-3 promptilla ”a ferret browsing a smartphone”. Kuvaa jatkettu Photoshopin Generative AI Fill-työkalulla. Kuva: Dalle-3

Tekoälymalli lukee iPhonen näyttöä

Apple on julkaissut uuden ”Ferret-UI” -nimisen multimodaalisen laajan kielimallin (MLLM), joka pystyy ymmärtämään puhelimen näytöllä tapahtuvia asioita. Ferret-UI pystyy tunnistamaan näytöllä näkyvien ikonien tyypit, löytämään tiettyjä tekstinpätkiä ja antamaan käyttäjälle tarkat ohjeet tietyn tehtävän suorittamiseksi näytöllä näkyvien asioiden perusteella.

Mallin tarkoituksena on automatisoida ja helpottaa käyttäjän vuorovaikutusta puhelimen kanssa. Se voi auttaa myös esteettömyydessä, sovellusten testaamisessa ja käytettävyyden arvioinnissa. Ei ole vielä tiedossa, tuleeko Ferret-UI osaksi huhuttua Siri 2.0:aa vai jääkö se vain tutkimusprojektiksi.

Ferret-UI:n kaltaiset mallit ovat tärkeä askel kohti tekoälyn parempaa integrointia älypuhelimiin, kun tekoälyavustajien odotetaan tulevaisuudessa välittävän suuren osan ihmisten digitaalisesta vuorovaikutuksesta. Lähde: Tom’s Guide, lue lisää

Spotify-soittolistoja tekoälyn avulla

Spotify on ottanut käyttöön uuden tekoälypohjaisen soittolistaominaisuuden, joka on tällä hetkellä beta-vaiheessa Premium-käyttäjille UK:ssa ja Australiassa. ”AI Playlist” -ominaisuuden avulla käyttäjät voivat luoda personoituja soittolistoja yksinkertaisesti kirjoittamalla ainutlaatuisen kehotteen sovelluksen chattiin. ”AI Playlist” yhdistää Spotifyn tehokkaan personointiteknologian tekoälyyn tavoitteenaan luoda jokaiselle käyttäjälle täydellinen musiikkivalikoima. Lue lisää

Sam Altman ja Jony Ive hakevat miljardirahoitusta tekoälylaitteelle

Applen entinen muotoilujohtaja Jony Ive ja OpenAI:n toimitusjohtaja Sam Altman ovat keräämässä vähintään miljardin dollarin rahoitusta uudelle yritykselle, joka tuottaa ”tekoälyllä toimivan henkilökohtaisen laitteen”. Laitteen tarkka luonne ja toiminnallisuus ovat vielä tässä vaiheessa tuntemattomia, mutta lähteiden mukaan se tulee näyttämään hyvin erilaiselta kuin tyypillinen älypuhelin. Ei ole vielä viitteitä siitä, että Altmanin yritys OpenAI olisi suoraan mukana tässä uudessa tekoälylaitteisto-startupissa. Altman on mukana monissa muissa tekoälyhankkeissa OpenAI:n lisäksi. Lähde: Ars Technica, lue lisää

Puhesynteesijärjestelmä avuksi puhekyvyn menettäneille

New Yorkin yliopiston (NYU) tutkimusryhmä on edistynyt merkittävästi neuraalisen puheen dekoodauksessa, mikä voisi auttaa puhekyvyn menettäneitä yksilöitä saamaan äänensä takaisin. Tutkijat yrittävät kehittää tapoja, joilla tietokoneet voisivat lukea heidän ajatuksiaan ja muuntaa ne puheeksi, jotta he voisivat jälleen kommunikoida. Tämä on kuitenkin erittäin vaikeaa, koska aivosignaalit ovat monimutkaisia ja jokaisen ihmisen aivot ovat hieman erilaiset. Lisäksi on vaikea saada tarpeeksi dataa aivoista ja niitä vastaavasta puheesta, jotta tietokone voisi oppia ymmärtämään niitä.

Tutkijat ovat luoneet tietokoneohjelman, joka koostuu kahdesta osasta:

  1. Dekooderi, joka muuntaa aivosignaalit numeroiksi, jotka kuvaavat puheen eri ominaisuuksia, kuten äänenkorkeutta ja voimakkuutta.
  2. Syntetisaattori, joka muuttaa nämä numerot takaisin ääneksi, joka kuulostaa oikealta puheelta.

Tutkijat kouluttivat tietokoneen ymmärtämään aivosignaaleja pyytämällä ihmisiä lukemaan ääneen samalla kun heidän aivosignaalejaan tallennettiin. He käyttivät myös toista tietokoneohjelmaa, joka oppi jäljittelemään oikeaa puhetta, auttaakseen dekooderia oppimaan paremmin.

Menetelmää testattiin 48 eri ihmisellä, myös niillä, joilla oli vaurioita vain toisella puolella aivoja. Menetelmä toimi ja se pystyi tuottamaan puhetta, joka kuulosti luonnolliselta, jopa silloin, kun se joutui arvaamaan, mitä ihminen aikoi sanoa seuraavaksi. Lue lisää

Havainnekuva Chen et al. (2024) tutkimusartikkelista

Kiinnostuitko tekoäly-yhtiöistä?

Sijoittaja360:n Kansainvälisen osaketyökalun avulla löydät ja vertailet helposti yhtiöitä. Osaketyökalu kuuluu Sijoittaja.fi-jäsenyyteen ja löydät sen Sijoittaja360 -osion alta.

Sijoittaja360:n Inspiroidu -osiosta löydät myös valmiin listan mielenkiintoisimmista tekoälyosakkeista.

Sinua voisi kiinnostaa
Tekoälyuutiset: Uusi askel ihmismäisempiin tekoälymalleihin
Helsingin pörssi on vihdoin kääntynyt – hakannut tuotossa jopa teknologiaosakkeet
Ovaro on todella aktiivinen – näkee pohjan olevan takana
WIMAO
Sijoittajan valinnat