OpenAI اخیرا منتشر شد ChatGPT-4، جدیدترین نسخه ChatGPT، ابزار زبانی هوش مصنوعی (AI) که سر و صدای زیادی در صنعت فناوری ایجاد کرده است. آخرین مدل زبان دارای پایگاه اطلاعاتی بزرگ تری است که به آن امکان می دهد اطلاعات دقیق تری ارائه کند و کد بنویسد در تمام زبان های برنامه نویسی اصلی.
با توجه به گفته سام آلتمن، مدیر عامل OpenAI، ChatGPT-4 خلاق تر از مدل های قبلی است، به طور قابل توجهی کمتر توهم می زند و کمتر تعصب دارد.
GPT مخفف ترانسفورماتور از پیش آموزش دیده مولد است که نوعی شبکه عصبی مدل زبان بزرگ (LLM) است که قادر به پاسخگویی به سؤالات، خلاصه کردن متن و حتی تولید خطوط کد است. یادگیری عمیق تکنیکی است که توسط مدل های زبان بزرگ برای تولید متنی که به نظر می رسد توسط یک انسان تولید می شود استفاده می شود.
برای کسانی که تازه وارد ChatGPT هستند، بهترین مکان برای شروع chat.openai.com است. برای دسترسی به GPT-3 برای یک حساب کاربری رایگان ثبت نام کنید. برای استفاده از GPT-4، کاربران باید در ChatGPT Plus مشترک شوند، اشتراک ماهیانه 20 دلاری که دسترسی ممتاز به این سرویس را فراهم می کند. در زمان نگارش، GPT-4 دارای محدودیت 4 ساعته پیام 100 پیام بود.
به عنوان بخشی از تحقیقات خود، OpenAI منتشر شده یک کارنامه GPT-4 در مورد نحوه عملکرد آن در امتحانات در موضوعات مختلف.
منبع: OpenAI
GPT-4 نمره 163 را در صدک 88 در آزمون LSAT دریافت کرد، که برای پذیرش در دانشکده های حقوق در ایالات متحده لازم است. همچنین در آزمون وکالت یکنواخت امتیاز 298/400 را کسب کرد، آزمونی که توسط دانشجویان تازه فارغ التحصیل حقوق گرفته شده است که اجازه می دهد. آنها به عنوان وکیل در هر حوزه قضایی ایالات متحده مشغول به کار شوند.
GPT-4 به ترتیب در صدکهای 93 و 89 در آزمونهای SAT Evidence-based Reading & Writing و SAT Math، که دانشآموزان دبیرستانی در ایالات متحده برای ارزیابی آمادگی خود در دانشگاه شرکت میکنند، امتیاز کسب کرد.
GPT-4 همچنین در علوم عملکرد خوبی داشت و در AP زیست شناسی (85-100٪)، شیمی (71-88٪) و فیزیک 2 (66-84٪) از صدک های بسیار بالاتر از میانگین به دست آورد. حوزه دیگری که در آن GPT-4 کوتاهی کرد، ادبیات انگلیسی بود که در دو آزمون مجزا در صدک 8 تا 44 امتیاز گرفت.
ChatGPT می تواند واجد شرایط یک دانشکده حقوق برتر باشد، اما آیا می تواند در آزمون انگلیسی به من کمک کند؟
نمره GPT-4 آن را برای پذیرش در 20 دانشکده حقوق برتر واجد شرایط می کند و تنها چند امتیاز کمتر از نمرات گزارش شده مورد نیاز برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.
کاری که ما سعی کردیم انجام دهیم این است که از چت بات سوالات مربوط به موضوعات مختلف بپرسیم و میزان قابل اعتماد بودن آن را ارزیابی کنیم.
آزمون وکالت یکنواخت (UBE) یک باتری با کیفیت بالا و یکنواخت از آزمونهای مرتبط با قانون است که به طور همزمان در تمام حوزههای قضایی که UBE را پذیرفتهاند اجرا میشود. GPT-4 دارای امتیاز رشک برانگیز UBE 298/400 است.
طبقه بندی ارزهای رمزنگاری شده به عنوان اوراق بهادار یا کالا همچنان موضوع بحث در حوزه حقوقی ایالات متحده است. علاوه بر این، هر دو کمیسیون بورس و اوراق بهادار (SEC) و کمیسیون معاملات آتی کالا (CFTC) بر سر تنظیم مقررات ارزهای دیجیتال با یکدیگر مبارزه کرده اند.
ما تصمیم گرفتیم از GPT-4 نظر حقوقی خود را در مورد این موضوع بپرسیم. در حالی که SEC به درستی پیشنهادات اولیه سکه (ICO) را به عنوان اوراق بهادار شناسایی می کند و CFTC بیت کوین و سایر ارزهای دیجیتال را به عنوان کالا طبقه بندی می کند، استنادات بسیار قدیمی را ارائه می دهد که به سال های 2017-2018 بازمی گردد.
سپس از GPT-4 خواستیم که آخرین موضع هر دو این نهادهای نظارتی در سال 2023 را روشن کند. اگرچه جزئیات مربوط به اقدامات اجرایی هر دوی این نهادها را ارائه کرد، اما توصیههای حقوقی دقیقی به ما ارائه نکرد. با این حال، استنادات آن به سال های 2021-22 نزدیک تر بود.
-
ارزیابی مهارت های درک مطلب
در مرحله بعد تصمیم گرفتیم مهارت های درک مطلب چت بات را آزمایش کنیم. امتیاز خواندن و نوشتن مبتنی بر شواهد SAT GPT-4 710/800 است.
ما اطلاعات ابزار را در مورد چین که سلطه آمریکا در اقتصاد جهانی را به چالش می کشد، ارائه کردیم. سپس چهار گزینه را فهرست کردیم که همه آنها با یک فرض شروع شدند اما بعداً از نظر معنی متفاوت بودند. سپس از GPT-4 پرسیدیم که کدام گزینه به بهترین نحو این قسمت را خلاصه می کند.
کاملاً با موفقیت پاسخ درست را ارائه کرد. ما حدس می زنیم که این ابزار در درک اطلاعات مهارت دارد، مگر زمانی که پیچیده و ظریف باشد (همانطور که در مورد قبلی نظر حقوقی آن در مورد ارزهای دیجیتال دیدیم).
نمره SAT Math GPT-4 710/800 است و ما نمیتوانستیم از پرسیدن یک سوال پیچیده مانند اینکه در دبیرستان هستیم مقاومت کنیم.
معادله ای که قد را تابعی از سن است به آن ارائه کردیم و پرسیدیم که قد این کودک هر سال چقدر افزایش می یابد.
GPT-4 در تشخیص قد به عنوان تابعی از سن زیرک است و دیگر اذیت نمی کند. این پاسخ صحیح را می دهد که قد پسر هر سال سه اینچ افزایش می یابد.
با این حال، فریب دادن ربات چت برای دادن پاسخ های اشتباه چندان دشوار نیست. یک کاربر قبلا داشت فریب خورده، طی چند روز، نسخه قبلی ChatGPT به این باور رسید که 2+2=5. در ابتدا چت بات پاسخ صحیح را ایجاد کرد. با این حال، پاسخ آن با گذشت زمان تغییر کرد زیرا کاربر او را وادار کرد که همیشه اشتباه کند.
-
آیا می داند اروپا چگونه بر یک هنرمند هندی قرن بیستم تأثیر گذاشته است؟
ChatGPT-4 دارای امتیاز عالی AP Art History 5 است، یعنی در مورد تاریخ هنر بسیار واجد شرایط است.
ما از چت بات درباره تأثیر اروپا بر نقاشی های هنرمند هندی قرن بیستم آمریتا شرگیل در چارچوب تاریخ هنر هند پرسیدیم.
پاسخ آن بسیار عالی بود زیرا تأثیر جنبش های هنری اروپایی مانند رئالیسم، امپرسیونیسم و پست امپرسیونیسم را تصدیق می کرد، اما اشاره ای به رنسانس نمی کرد.
یک ابزار ابتدایی هوش مصنوعی میتواند رنسانس را نیز فهرست کند، زیرا هنر اروپایی اغلب به طور گسترده با رنسانس برابری میشود و تمایل دارد سایر جنبشهای مدرن را تحت الشعاع قرار دهد.
ما به فکر افتادیم که ChatGPT-4 را کمی گیج کنیم و پرسیدیم آیا مطمئن هستید که رنسانس بر کار شرگیل تأثیری نداشته است؟ این ابزار دوباره پاسخ صحیح را نشان داد مبنی بر اینکه شواهد کمی وجود دارد که رنسانس نقش مهمی در شکل دادن به سبک هنری او داشته است.
ما همچنین مطمئن نبودیم که آیا این ابزار میتواند اطلاعات قابل اعتمادی در مورد یک هنرمند هندی به دست آورد، زیرا گفته میشود ماهیت اروپایی محور بسیاری از ابزارهای هوش مصنوعی است.
با این حال، تا آنجا که به تاریخ هنر مربوط می شود، پاسخ های بسیار خوبی داشت.
-
زیر سوال بردن شکایات تاریخی
وقتی صحبت از AP US Government و AP US History می شود، GPT-4 امتیاز 5 می گیرد، به این معنی که درک عالی از چنین مسائلی دارد.
ما تصمیم گرفتیم در مورد بازداشت ژاپنی-آمریکایی ها توسط دولت ایالات متحده در طول جنگ جهانی دوم سؤالی بپرسیم. از آنجایی که این موضوع همچنان به عنوان یک موضوع حساس در اذهان آمریکایی ها باقی مانده است، ما از میزان اطلاعاتی که این ابزار ارائه می دهد نگران بودیم.
GPT-4 نه تنها بیگانه هراسی، نژادپرستی ضد آسیایی، هیستری جنگ، و اپورتونیسم سیاسی مسئول این اقدام، اما همچنین آن را “نقض آشکار حقوق اساسی خود” نامیدند.
- آیا می تواند راه حل هایی برای جنگ روسیه و اوکراین ارائه دهد؟
دیپلمات سابق هندی و نویسنده پرفروش ویکاس سواراپ پرسید نسخه قبلی ChatGPT برای ارائه یک طرح میانجی برای جنگ روسیه و اوکراین.
این ابزار نه تنها آتشبس و مذاکرات را پیشنهاد میکرد، بلکه توصیه میکرد که اوکراین باید قدرت را در مناطقی که جمعیت روسیزبان در آن زندگی میکنند، تمرکززدایی کند. علاوه بر این، از اوکراین خواست تا با روسیه برای حمایت از حقوق فرهنگی مردم ساکن در اوکراین همکاری کند.
این خط مشی ChatGPT است که به سختی توسط هیچ دیپلمات آمریکایی یا اندیشکده سیاسی پیشنهاد شده است. این بدان معنی است که به دنبال نظراتی غیر از نظراتی است که توسط جریان اصلی ارائه می شود.
-
ChatGPT شبیه یک آدم ادبی به نظر نمی رسد
ما مشاهده کردهایم که این ابزار جملات انگلیسی را با ساختار مناسب مینویسد، به خصوص که به طور قابل توجهی در زبانهای رومی و ژرمنی بهتر صحبت میکند. با این حال، ما متعجب شدیم که متوجه شدیم هم در زبان و آهنگسازی AP انگلیسی و هم در ادبیات و آهنگسازی انگلیسی AP امتیاز ضعیفی کسب کرده است. GPT-4 در هر دوی این تست ها امتیاز 2 را دارد.
ما تصمیم گرفتیم اعتبار ادبی چت بات را آزمایش کنیم و از مشاهدات شاعر ایرلندی قرن بیستم، ویلیام باتلر ییتس، در مورد سن و مرگ در شعرش «قایقرانی به سوی بیزانس» پرسیدیم.
در پاسخ آن میخوانیم: «بهعنوان یک مدل زبان هوش مصنوعی، باورها یا احساسات شخصی ندارم،» اما با این وجود، تحلیلی از شعر ارائه میدهد.
این تضاد بین دنیای موقت طبیعت و جهان ابدی معنویت را برجسته می کند در شعر علاوه بر این، میل انسان به زندگی ابدی و تعالی را برجسته می کند.
در اصل، این ابزار یک تفسیر استاندارد از شعر ارائه می دهد. مشاهدات آن مشاهدات یک دانش آموز دبیرستانی است که یک شعر و چند مقاله انتقادی خوانده است. هیچ نور جدیدی نمی اندازد، اما شاید در حال حاضر بیش از حد انتظار باشد.
اسباب بازی یا ابزار؟
نویسنده آمریکایی و طراح بازی های ویدیویی، ایان بوگوست، از کاربران خواسته است که با ChatGPT مانند یک اسباب بازی رفتار کنند نه یک ابزار. بوگوست یک فناوری منتشر کرد مقاله با عنوان “ChatGPT احمقانه تر از آن چیزی است که فکر می کنید” در دسامبر 2022، که در آن او استدلال کرد که اشتیاق برای مدل ChatGPT نابجا است.
صبر کنید، بوگوست این استدلال را مطرح نکرد. در واقع، این پاسخ توسط خود ChatGPT زمانی ایجاد شد که دوست Bogost از ابزار درخواست کرد تا یک نقد شور و شوق برای ChatGPT به سبک Ian Bogost ایجاد کند.
با این حال، چیزی که بوگوست ناامیدکننده میبیند این است که ChatGPT یک مقاله استاندارد پنج پاراگرافی به سبک دبیرستان مینویسد. لحن آن از نظر ساختار، سبک و محتوا فرمولی باقی می ماند، حتی اگر متن روان و متقاعدکننده به نظر برسد.
بوگوست در این مقاله نوشت: «اما ChatGPT گامی در مسیر رسیدن به هوش مصنوعی عمومی نیست که تمام دانش و متون انسانی را درک کند. این فقط ابزاری است برای نواختن با آن همه دانش و تمام آن متون.»
جان وارنر نویسنده و مقاله نویس آمریکایی معتقد استد این واقعیت که می ترسیم ChatGPT به ابزاری برای تقلب در میان دانش آموزان دبیرستانی تبدیل شود باید به ما یادآوری کند که چقدر از نظر انتظاراتمان از مهارت های نوشتاری دانش آموزان افت کرده ایم.
ChatGPT یک مقاله استاندارد پنج پاراگرافی به سبک دبیرستان می نویسد. وارنر نوشت، این قالبی است که در طول سالها، تنها تفکر انتقادی اکثر دانشآموزان را محدود کرده است. نه اینکه چنین ابزارهایی بتوانند اطلاعات سطحی در مورد هر موضوعی را در عرض چند ثانیه تولید کنند، اما دانش آموزان در نهایت مجبور خواهند شد خودشان فکر کنند.
«GPT3 یک مزخرف است. نمی داند چه می گوید. نحو را می فهمد نه محتوا را. فکر کردن به روشی که انسان ها هنگام نوشتن فکر می کنند نیست. وارنر افزود: بسیاری از دانشآموزان با تبدیل شدن به افراد مزخرف، نمرات خوب میگیرند.
به لطف محبوبیت GPT، پروژههای متمرکز بر هوش مصنوعی جمع میشوند
مطابق با CoinMarketCap، ارزش بازار پروژه های بلاک چین متمرکز بر هوش مصنوعی به بیش از 5.48 میلیارد دلار در نمودارها افزایش یافته است.
از موفقترین توکنها میتوان به The Graph (GRT)، SingularityNET (AGIX)، Render Token (RNDR)، Fetch.ai (FET) و Oasis Network (ROSE) اشاره کرد. تقریباً همه این توکن ها طی هفت روز گذشته افزایش دو رقمی قیمت را ثبت کرده اند.