AI - mesterséges intelligencia hírek, magyarul

Damien Charlotin from Artificial Authority2026-07-03

Az LLM-hallucinations nem véletlenek: mintázatok az amerikai bíróságokon

Hallucinations in Courts - Much More than you Wanted to Know

Az Artificial Authority adatbázisa közelít az 1200 kitalált hivatkozási esethez az amerikai bíróságokon, és a szerző most részletesen megvizsgálta, hogy ezek a hamis esetnevek milyen szabályszerűségeket mutatnak. Az elemzés mintegy 5000 granulált hamis idézetre és körülbelül 2000 egyedi kitalált esetnévre támaszkodik, amelyeket Python-alapú adatelemzéssel vizsgált meg.

Az egyik legfontosabb megállapítás, hogy a kitalált hivatkozások körülbelül 20%-a proprietáris azonosítót (Westlaw vagy LexisNexis) tartalmaz, szemben a valódi, de félrehasznált esetekkel, amelyek többnyire semleges azonosítókat használnak. Ez különösen problémás, mivel egy paywallal védett azonosítójú eset létezését szinte lehetetlen ellenőrizni anélkül, hogy az adott platformhoz hozzáférése lenne a jogásznak.

A hamis esetnevek nem véletlenszerűek: az LLM-ek jellemzően a tárgyalt ügy szakterületéhez, feleihez és bírósági helyszínéhez közel maradnak. A Mata v. Avianca-ügyben például szinte minden kitalált hivatkozásnak repülős tematikája volt, az ismétlődő esetnevekben pedig túlnyomórészt közönséges nevek (pl. 'Miller v. United States') szerepeltek helytelen azonosítókkal. Az LLM-ek tehát – emberekhez hasonlóan – az ismerős mintákat követik, ami a hamis hivatkozásokat hitelesnek látszóvá és nehezen észlelhetővé teszi.

Az eredeti cikk megnyitása →

Rohan Paul from Rohan's Bytes2026-04-17

Claude Opus 4.7, Tencent HY-World 2.0 és az AI kognitív hatásai

🗞️ Claude Opus 4.7 launched as ‘less powerful’ version of Mythos

Az Anthropic kiadta a Claude Opus 4.7-et, amely jelentős fejlesztés az Opus 4.6-hoz képest szoftverfejlesztési és hosszú futású ügynöki feladatokhoz. Az új modell magasabb felbontású képfeldolgozást (2576px), jobb fájlrendszer-alapú memóriát és egy új 'xhigh' erőfeszítési szintet kínál, amely finomabb vezérlést ad a következtetés és a késleltetés közötti kompromisszum felett. Az árazás változatlan marad: 5 USD/M input token és 25 USD/M output token.

A Tencent nyílt forráskódként publikálta a HY-World 2.0-t, egy multimodális világmodellt, amely szövegből, képekből és videókból interaktív 3D-s jeleneteket generál meshek és Gaussian splatok formájában. A modell ezzel túllép a pixelalapú videogeneráción, lehetővé téve, hogy az elkészült jeleneteket Blender, Unity, Unreal vagy Isaac Sim eszközökbe importálják és szerkesszék.

A Perplexity elindította a Personal Computer nevű Mac-funkciót, amely egy teljes értékű AI-ügynökként működik, közvetlen hozzáféréssel helyi fájlokhoz, natív alkalmazásokhoz (Mail, Calendar, iMessage) és böngészőhöz. A rendszer hibrid architektúrát alkalmaz: a nehéz orchestrációs feladatok a Perplexity szerverein futnak, míg a helyi fájlhozzáférés a Mac gépen történik, így egy Mac minin beállítva 24/7-es ügynökként üzemelhet.

Egy MIT, Oxford és Carnegie Mellon közös tanulmánya szerint az AI-segítség rövid távon javítja a teljesítményt, de már mintegy 10 perc elteltével gyengíti az önálló problémamegoldó képességet. A kutatás 1200 résztvevőn végzett 3 kísérletben kimutatta, hogy azok, akik GPT-5 alapú asszisztenst használtak közvetlen válaszokhoz, kevesebbet oldottak meg önállóan, és hamarabb feladták a feladatot – szemben azokkal, akik csak tipprendszerként alkalmazták az AI-t.

Az eredeti cikk megnyitása →