گوگل دیپ‌مایند: سم‌زدایی داده‌ها برای آموزش بهتر هوش مصنوعی

گوگل دیپ‌مایند با سم‌زدایی داده‌ها کمبود منابع هوش مصنوعی را حل می‌کند بحران داده در توسعه‌ی هوش مصنوعی مدل‌های هوش مصنوعی هر روز بزرگ‌تر می‌شوند و داده‌های سالم کم‌تر می‌شوند. دیپ‌مایند برای حل این مشکل روش تازه‌ای معرفی کرد: سم‌زدایی داده‌ها. این روش داده‌های آلوده به سوگیری، نفرت‌پراکنی یا اطلاعات نادرست را پاک‌سازی می‌کند. در

اندازه متن

گوگل دیپ‌مایند با سم‌زدایی داده‌ها کمبود منابع هوش مصنوعی را حل می‌کند

بحران داده در توسعه‌ی هوش مصنوعی

مدل‌های هوش مصنوعی هر روز بزرگ‌تر می‌شوند و داده‌های سالم کم‌تر می‌شوند. دیپ‌مایند برای حل این مشکل روش تازه‌ای معرفی کرد: سم‌زدایی داده‌ها. این روش داده‌های آلوده به سوگیری، نفرت‌پراکنی یا اطلاعات نادرست را پاک‌سازی می‌کند. در نتیجه این داده‌ها دوباره برای آموزش مدل‌ها به کار می‌روند و منابع موجود طولانی‌تر می‌شوند.

سم‌زدایی داده‌ها چگونه عمل می‌کند؟

پژوهشگران دیپ‌مایند الگوریتمی ساختند که داده‌های مشکل‌دار را شناسایی می‌کند. این الگوریتم بخش‌های سمی متن را بازنویسی یا حذف می‌کند و بخش مفید را نگه می‌دارد. به این شکل، حجم بزرگی از داده‌های حذف‌شده دوباره وارد چرخه می‌شود.
گزارش مؤسسه Epoch AI نشان می‌دهد که داده‌های عمومی ممکن است تا سال ۲۰۲۶ تمام شوند. نوآوری دیپ‌مایند می‌تواند این پایان را به تعویق بیندازد.

تأثیرات اخلاقی و اجتماعی

سم‌زدایی فقط تعداد داده‌ها را افزایش نمی‌دهد؛ بلکه کیفیت آموزش را هم بالا می‌برد. داده‌های سالم مانع انتقال تبعیض یا نفرت به خروجی مدل‌ها می‌شوند. این کار همچنین از پدیده‌ی «فروپاشی مدل» جلوگیری می‌کند؛ یعنی وضعیتی که مدل با داده‌های تولیدشده‌ی خودش ضعیف‌تر می‌شود.

رقابت میان شرکت‌های بزرگ

دیپ‌مایند این پروژه را در زمانی حساس آغاز کرد. گوگل، متا و اوپن‌ای‌آی برای دسترسی به داده‌های باکیفیت رقابت می‌کنند. دمیس هسابیس، مدیرعامل دیپ‌مایند، بر توسعه‌ی مسئولانه تأکید می‌کند تا اشتباهات شبکه‌های اجتماعی تکرار نشوند.
این روش به شرکت‌ها کمک می‌کند بدون وابستگی کامل به داده‌های مصنوعی یا انحصاری، آموزش مدل‌ها را ادامه دهند.

چالش‌ها و محدودیت‌ها

کارشناسان می‌گویند سم‌زدایی بی‌نقص نیست. برخی سوگیری‌ها پنهان می‌مانند و نتایج را مخدوش می‌کنند. علاوه بر این، محدودیت‌های قانونی همچنان باقی است. بسیاری از ناشران استفاده از محتوای خود را برای آموزش مدل‌ها ممنوع کرده‌اند. بنابراین موفقیت این روش به آزمایش‌های دقیق و پذیرش گسترده در صنعت بستگی دارد.

چشم‌انداز آینده

دیپ‌مایند می‌تواند سم‌زدایی داده‌ها را همراه روش‌های دیگری مثل «محاسبه در زمان پرسش» به کار ببرد. این ترکیب، بحران کمبود داده را به تعویق می‌اندازد و توسعه‌ی اخلاقی هوش مصنوعی را ممکن می‌کند.

دنبال اخبار بیشتر باشید…

برای آگاهی از تازه‌ترین خبرها، تحلیل‌ها در حوزه هوش مصنوعی ، به سایت خانه متاورس ایران مراجعه کنید.

دنبال اخبار بیشتر باشید…

نویسنده کوثر بختی
درباره نویسنده کوثر بختی