OpenAI به تازگی GDPval را معرفی کرده است، که یک معیار جدید برای ارزیابی تواناییهای AI در مقایسه با انسانها در 44 حوزه شغلی کلیدی است. آزمایشها نشان میدهد که نمره GPT-5-high در مقایسه با متخصصان مشابه یا حتی فراتر از متخصصان 40.6% است، در حالی که نمره Claude Opus 4.1 از Anthropic برابر با 49% است—این نشان میدهد که OpenAI به دنبال بهبود عملکرد Claude در زمینه پردازش تصویر است. مدیر ارشد اقتصادی OpenAI به محدودیتهای فعلی AI اشاره کرده، اما تأکید کرده است که این نتایج نشاندهنده تواناییهای بالقوه AI در انجام وظایف روزمره است، که میتواند به متخصصان کمک کند تا بر روی کارهای با ارزشتر تمرکز کنند. در مقایسه با 15 ماه پیش، نمره GPT-4o برابر با 13.7% بود، که نشاندهنده پیشرفت قابل توجهی است.
OpenAI اعلام کرد که GPT-5 در بسیاری از حوزههای شغلی میتواند با انسانها رقابت کند
تاریخ انتشار :۲۳:۱۶ - ۱۴۰۴/۰۷/۰۳