ComputerTrends magazin 2024.04.10.
A ComputerTrends magazin 2024. április 10-én megjelent lapszáma.
A ComputerTrends magazin 2024. április 10-én megjelent lapszáma.
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
KIS<br />
ENDRE<br />
TECHNOLÓGIA #AI<br />
MICROSOFT<br />
Modellek és másodpilóták<br />
A kis nyelvi modellek és a multimodális AI mellett a mesterséges intelligencia és a<br />
tudományos kutatás szorosabb összefonódása lehet az idei év három nagy trendje<br />
a Microsoft szerint. A Copilot alkalmazásait széles körben elérhetővé tevő szoftvercég<br />
az AI modellek tanítását és bevezetését támogató Azure felhőinfrastruktúráját is új<br />
képességekkel bővíti.<br />
Fontos év volt a tavalyi a generatív<br />
mesterséges intelligencia<br />
történetében, miután a kutató<br />
központokból kiszabaduló technológia<br />
népszerű eszközeit – közöttük<br />
a ChatGPT szolgáltatást és a Copilot<br />
alkalmazásokat – lakossági és vállalati<br />
felhasználók milliói kezdték a gyakorlatban<br />
használni, mutatott rá blogbejegyzésében<br />
(3 big AI trends to watch in<br />
2024) a Microsoft.<br />
Idén a mesterséges intelligencia<br />
még szélesebb körben hozzáférhetővé,<br />
árnyaltabbá válik, és más technológiákkal<br />
szorosabban összekapcsolódik,<br />
hogy a hétköznapi feladatok elvégzését<br />
éppúgy segítse, mint a világ legnagyobb<br />
kihívásainak megválaszolását.<br />
A szoftvercég szerint 2024-ben ugyanis<br />
három nagy trend, a kis nyelvi modellek<br />
és a multimodális AI térhódítása<br />
fogja meghatározni ezt a területet, a<br />
technológia eddiginél kiterjedtebb, tudományos<br />
célú alkalmazásával együtt.<br />
Kicsi a nyelvi modell,<br />
de erős<br />
Jóllehet a nagy nyelvi modellek (LLM-ek)<br />
a felhasználók ChatGPT-hez vagy Copilot<br />
alkalmazásokhoz intézett, legösszetettebb<br />
kérdéseit is megválaszolják,<br />
méretüknél fogva futtatásuk olyan<br />
jelentős számítási erőforrásokat követel,<br />
amelyekkel csak a nagy (felhő)adatközpontok<br />
szolgálhatnak. A piacon ezért<br />
sorra jelennek meg a kis nyelvi modellek<br />
(SLM-ek), amelyek több száz milliárd<br />
paraméter – a modell viselkedését<br />
meghatározó változó – helyett csupán<br />
pár milliárd paramétert tartalmaznak,<br />
és már elég kicsik ahhoz, hogy offline<br />
üzemmódban, akár egy telefonon is<br />
futtathatók legyenek, figyelemre méltó<br />
teljesítménnyel.<br />
A Microsoft kutatói mostanáig két kis<br />
nyelvi modellt fejlesztettek és adtak<br />
közre Phi, illetve Orca néven, amelyek<br />
bizonyos területeken még jobban is teljesítenek,<br />
mint a nagy nyelvi modellek.<br />
Az interneten elérhető, hatalmas adattömegeken<br />
tanított LLM-ektől eltérően<br />
az SLM-eket a kutatók ugyanis válogatott,<br />
kiváló minőségű adatokon tanítják,<br />
így a kisebb modellekkel mind méret,<br />
mind teljesítmény vonatkozásában újabb<br />
határokat lépnek át.<br />
Copilot Pro: személyi AI asszisztens profi képességekkel<br />
Míg a nagy nyelvi modellek egyetlen<br />
adattípussal, szöveggel dolgoznak, a<br />
multimodális AI a szöveges információk<br />
mellett a képeket, a hang- és videofelvételeket<br />
– rögzített vagy élő adatfolyamokat<br />
– is értelmezi. Képességeinek<br />
köszönhetően ez a technológia az információkeresésben<br />
és a tartalomalkotó<br />
alkalmazásokban is gazdagabb és<br />
pontosabb eredményekkel, zökkenőmentes<br />
élménnyel szolgál.<br />
Copilot alkalmazásától a felhasználó<br />
például megkérdezheti, hogy mit<br />
ábrázol a kép, amelyet feltöltött. A kép<br />
mellett a természetes nyelvet és a Bing<br />
keresés adatait is feldolgozó, multimodális<br />
modelljével az alkalmazás<br />
ugyanis szavakban össze tudja foglalni<br />
a képen látható műemlék történelmi<br />
jelentőségét. Multimodális AI működik<br />
a Microsoft Designer grafikus tervező<br />
alkalmazásában, amely szóbeli utasításra<br />
képeket készít, és ilyen modell<br />
állítja elő a fogyatékkal élő felhasználókat<br />
támogató szövegolvasó alkalmazás<br />
természetesnek ható szintetikus, testre<br />
szabható neurális hangját is.<br />
Ismeretes, hogy a mesterséges intelligencia<br />
a tudományos kutatás folyamatát<br />
nagy mértékben felgyorsíthatja,<br />
és a Microsoft prognózisa szerint ezen<br />
a téren idén is további előrelépések<br />
várhatók. A szoftvercég kutatói például<br />
AI alapokon fejlesztenek jobb időjáráselőrejelző,<br />
szénlábnyom-számító és<br />
más eszközöket a mezőgazdaság fenntarthatóbbá<br />
tételéhez, valamint olyan<br />
chatbot alkalmazásokat is készítenek,<br />
amelyekkel a gazdák a helyszínen, a<br />
termőföldeken is könnyen beazonosíthatják<br />
a gyomnövényeket, illetve<br />
összevethetik az öntözés különböző<br />
módszereivel elért hatásfokot.<br />
Az élettudományok területén a<br />
kutatók a világ legnagyobb, képalapú AI<br />
modelljét építik a rákbetegségek elleni<br />
küzdelem támogatásához, és a mesterséges<br />
intelligencia segíti a járványok<br />
leküzdéséhez szükséges új gyógyszerek<br />
kifejlesztését is. A próbálkozások és<br />
18 | <strong>ComputerTrends</strong> | 2024. április