28.04.2024 Views

ComputerTrends magazin 2024.04.10.

A ComputerTrends magazin 2024. április 10-én megjelent lapszáma.

A ComputerTrends magazin 2024. április 10-én megjelent lapszáma.

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

KIS<br />

ENDRE<br />

TECHNOLÓGIA #AI<br />

MICROSOFT<br />

Modellek és másodpilóták<br />

A kis nyelvi modellek és a multimodális AI mellett a mesterséges intelligencia és a<br />

tudományos kutatás szorosabb összefonódása lehet az idei év három nagy trendje<br />

a Microsoft szerint. A Copilot alkalmazásait széles körben elérhetővé tevő szoftvercég<br />

az AI modellek tanítását és bevezetését támogató Azure felhőinfrastruktúráját is új<br />

képességekkel bővíti.<br />

Fontos év volt a tavalyi a generatív<br />

mesterséges intelligencia<br />

történetében, miután a kutató<br />

központokból kiszabaduló technológia<br />

népszerű eszközeit – közöttük<br />

a ChatGPT szolgáltatást és a Copilot<br />

alkalmazásokat – lakossági és vállalati<br />

felhasználók milliói kezdték a gyakorlatban<br />

használni, mutatott rá blogbejegyzésében<br />

(3 big AI trends to watch in<br />

2024) a Microsoft.<br />

Idén a mesterséges intelligencia<br />

még szélesebb körben hozzáférhetővé,<br />

árnyaltabbá válik, és más technológiákkal<br />

szorosabban összekapcsolódik,<br />

hogy a hétköznapi feladatok elvégzését<br />

éppúgy segítse, mint a világ legnagyobb<br />

kihívásainak megválaszolását.<br />

A szoftvercég szerint 2024-ben ugyanis<br />

három nagy trend, a kis nyelvi modellek<br />

és a multimodális AI térhódítása<br />

fogja meghatározni ezt a területet, a<br />

technológia eddiginél kiterjedtebb, tudományos<br />

célú alkalmazásával együtt.<br />

Kicsi a nyelvi modell,<br />

de erős<br />

Jóllehet a nagy nyelvi modellek (LLM-ek)<br />

a felhasználók ChatGPT-hez vagy Copilot<br />

alkalmazásokhoz intézett, legösszetettebb<br />

kérdéseit is megválaszolják,<br />

méretüknél fogva futtatásuk olyan<br />

jelentős számítási erőforrásokat követel,<br />

amelyekkel csak a nagy (felhő)adatközpontok<br />

szolgálhatnak. A piacon ezért<br />

sorra jelennek meg a kis nyelvi modellek<br />

(SLM-ek), amelyek több száz milliárd<br />

paraméter – a modell viselkedését<br />

meghatározó változó – helyett csupán<br />

pár milliárd paramétert tartalmaznak,<br />

és már elég kicsik ahhoz, hogy offline<br />

üzemmódban, akár egy telefonon is<br />

futtathatók legyenek, figyelemre méltó<br />

teljesítménnyel.<br />

A Microsoft kutatói mostanáig két kis<br />

nyelvi modellt fejlesztettek és adtak<br />

közre Phi, illetve Orca néven, amelyek<br />

bizonyos területeken még jobban is teljesítenek,<br />

mint a nagy nyelvi modellek.<br />

Az interneten elérhető, hatalmas adattömegeken<br />

tanított LLM-ektől eltérően<br />

az SLM-eket a kutatók ugyanis válogatott,<br />

kiváló minőségű adatokon tanítják,<br />

így a kisebb modellekkel mind méret,<br />

mind teljesítmény vonatkozásában újabb<br />

határokat lépnek át.<br />

Copilot Pro: személyi AI asszisztens profi képességekkel<br />

Míg a nagy nyelvi modellek egyetlen<br />

adattípussal, szöveggel dolgoznak, a<br />

multimodális AI a szöveges információk<br />

mellett a képeket, a hang- és videofelvételeket<br />

– rögzített vagy élő adatfolyamokat<br />

– is értelmezi. Képességeinek<br />

köszönhetően ez a technológia az információkeresésben<br />

és a tartalomalkotó<br />

alkalmazásokban is gazdagabb és<br />

pontosabb eredményekkel, zökkenőmentes<br />

élménnyel szolgál.<br />

Copilot alkalmazásától a felhasználó<br />

például megkérdezheti, hogy mit<br />

ábrázol a kép, amelyet feltöltött. A kép<br />

mellett a természetes nyelvet és a Bing<br />

keresés adatait is feldolgozó, multimodális<br />

modelljével az alkalmazás<br />

ugyanis szavakban össze tudja foglalni<br />

a képen látható műemlék történelmi<br />

jelentőségét. Multimodális AI működik<br />

a Microsoft Designer grafikus tervező<br />

alkalmazásában, amely szóbeli utasításra<br />

képeket készít, és ilyen modell<br />

állítja elő a fogyatékkal élő felhasználókat<br />

támogató szövegolvasó alkalmazás<br />

természetesnek ható szintetikus, testre<br />

szabható neurális hangját is.<br />

Ismeretes, hogy a mesterséges intelligencia<br />

a tudományos kutatás folyamatát<br />

nagy mértékben felgyorsíthatja,<br />

és a Microsoft prognózisa szerint ezen<br />

a téren idén is további előrelépések<br />

várhatók. A szoftvercég kutatói például<br />

AI alapokon fejlesztenek jobb időjáráselőrejelző,<br />

szénlábnyom-számító és<br />

más eszközöket a mezőgazdaság fenntarthatóbbá<br />

tételéhez, valamint olyan<br />

chatbot alkalmazásokat is készítenek,<br />

amelyekkel a gazdák a helyszínen, a<br />

termőföldeken is könnyen beazonosíthatják<br />

a gyomnövényeket, illetve<br />

összevethetik az öntözés különböző<br />

módszereivel elért hatásfokot.<br />

Az élettudományok területén a<br />

kutatók a világ legnagyobb, képalapú AI<br />

modelljét építik a rákbetegségek elleni<br />

küzdelem támogatásához, és a mesterséges<br />

intelligencia segíti a járványok<br />

leküzdéséhez szükséges új gyógyszerek<br />

kifejlesztését is. A próbálkozások és<br />

18 | <strong>ComputerTrends</strong> | 2024. április

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!