محققان آمریکایی از دیپ سیک تقلید کردند

حمیدرضا 2025-02-01

0 0 خواندن این مطلب 1 دقیقه زمان میبرد

تحقیقات هوش مصنوعی معمولاً زمین بازی شرکت های بزرگ فناوری با بودجه های بزرگ است ، اما پس از شرکت چینی شش ادعا با سرمایه 2 میلیون دلاری برای رقابت با GPT CHAT. داده ها در بازار ایجاد شده است. تیمی از محققان دانشگاه یوسف برکلی اکنون قابلیت های اصلی مدل R4-Zero Dip Sik را با قیمت 5 دلار تکرار کرده اند.

این پروژه با نام Tayini Zero نشان می دهد که هزینه توسعه مدلهای پیشرفته هوش مصنوعی پیشرفته لزوماً نیازی به هزینه های زیادی ندارد. با این وجود لازم به ذکر است که هوش مصنوعی نیز بیشتر و بیشتر در دسترس بوده است.

تیمی از محققان به سرپرستی جیایی پان تصمیم به بازسازی مدل استدلال DIP SIK با استفاده از فناوری “یادگیری تقویت” (RL) گرفتند. آنها به جای تکیه بر خدمات ابررسانا یا قدرت محاسباتی گران قیمت ، Tayini Zero را با کمک یک مدل زبان اساسی ، یک محرک و یک سیستم پاداش ساده آموزش دادند.

پان در شبکه X -social نوشت: “شما می توانید لحظه” آه “خود را با 2 دلار تجربه کنید.”

وی توضیح داد که Taini Ziro اولین تولید مثل مدل های استدلال است که نشان دهنده توانایی آنها در تأیید و تصحیح پاسخ های آنها است.

محققان برای آزمایش مدل از بازی به نام Kant Down استفاده کردند که بازیکنان آنها با استفاده از محاسبات اساسی ریاضی مجبور به دستیابی به رقم مورد نظر بودند. اگرچه در ابتدا Tayin Zero جواب را حدس زد ، اما برای زمان پاسخ های او را تأیید می کند ، به جستجوی پاسخ های بهتر و سازگاری می پردازد.

در آزمایشات خود ، آنها از مدل های هوش مصنوعی در اندازه های مختلف از 1 میلیون تا 5 میلیارد پارامتر استفاده کردند. نتایج نشان داد که مدل های کوچکتر پس از حدس زدن پاسخ متوقف شدند. اما مدلهای بزرگ عزت نفس بهبود راه حل ها و دقت را به میزان قابل توجهی افزایش داد.

Taini Zero یک مدل هوش مصنوعی منبع باز است و کاربران در مرکز گیت می توانند به آن دسترسی پیدا کنند. اگرچه این مدل در حال حاضر فقط بر روی بازی کانت آزمایش شده است ، پان امیدوار است که این پروژه تحقیقات یادگیری تقویت را در دسترس تر کند.

حمیدرضا 2025-02-01

0 0 خواندن این مطلب 1 دقیقه زمان میبرد