this post was submitted on 20 Apr 2025
1 points (100.0% liked)

Informatica (Italy e non Italy 😁)

1521 readers
9 users here now

Ecco finalmente la comunità italiana Lemmy dedicata all'informatica!

Questo è il luogo in cui condividere post sul mondo dell'informatica: notizie su hardware e software, cybersecurity, cyberwarfare, hacking, nuovi prodotti, data breach!

Ricordiamo che esistono anche alcune comunità che si occupano di argomenti più specifici, quali:

Regole della comunità:

🏳️‍🌈 chiediamo educazione e rispetto per gli altri

🎃 anche se ci chiamiamo "Informatica" non banniamo gli utenti a caso 😁

🚫 trolling, shitposting e molestie sono vietati

💲 è vietato superare il confine che separa l'informazione dalla pubblicità

🔊 evitiamo il clickbait e il sensazionalismo

📖 per il resto valgono le regole dell'istanza al link https://feddit.it/post/6

founded 2 years ago
MODERATORS
 

👨🏻‍💻 Gli agenti devono gestire ordini, inventari, prezzi e costi giornalieri, facendo emergere la loro capacità di decisioni coerenti su lunghe durate.

🗒 Nonostante le prestazioni notevoli di alcuni modelli di LLM come Claude 3.5 Sonnet e o3-mini nella gestione, tutti gli agenti mostrano difficoltà nel mantenere coerenza a lungo termine. Le cause dei loro fallimenti includono interpretazioni errate dello stato operativo e deviazioni in compiti secondari.

🚨 Una traccia interessante è quando in uno dei test il modello si "stressa" non riuscendo a effettuare ordini e decidendo di chiudere l'attività (non può farlo). Vedendo che gli stanno addebitando comunque una tassa giornaliera rimane perplesso e vuole contattare l'FBI.

no comments (yet)
sorted by: hot top controversial new old
there doesn't seem to be anything here