مجله اینترنتی یستا

رسانه تخصصی اینترنتی یستا

از محتوای وب می‌توان برای آموزش هوش مصنوعی بهره برد

تبلیغات بنری



یکی از بزرگترین بحث‌ها در دنیای هوش مصنوعی مولد این است که آیا شرکت‌ها می‌توانند این مدل‌ها را با استفاده از داده‌های دارای حق چاپ در وب آموزش دهند. این مشکل تاکنون منجر به شکایت های متعددی علیه شرکت های هوش مصنوعی از جمله مایکروسافت و OpenAI شده است. اکنون مصطفی سلیمان، مدیر هوش مصنوعی مایکروسافت، آشکارا می گوید که هر کسی می تواند از این داده ها بهره مند شود.

مصطفی سلیمان اخیرا با اندرو راس سورکین مجری شبکه CNBC مصاحبه کرده و یکی از بحث برانگیزترین موضوعات را مورد بحث قرار داده است: آموزش هوش مصنوعی. مصطفی سلیمان در بخشی از این گفت و گو درباره استفاده رایگان از داده ها در اینترنت می گوید:

قرارداد اجتماعی برای محتوا از دهه 1990 این بود که هر کسی می‌تواند آن را کپی، تکثیر یا بازتولید کند [محتوا] “رایگان است.”

این مصاحبه در جشنواره ایده های آسپن انجام شده است.

نظرات مصطفی سلیمان در مورد آموزش هوش مصنوعی

مصطفی سلیمان همچنین درباره محتوایی که ناشر اجازه استفاده از آن را نداده است، صحبت کرد. او می گوید که علاوه بر محتوای باز موجود در وب، دسته بندی جداگانه ای نیز وجود دارد که وب سایت، ناشر یا سازمان خبری به صراحت اعلام کرده است که به هر دلیلی نباید ایندکس و خراش داده شود. به گفته مصطفی سلیمان، این مقوله خاکستری است و استفاده از آن احتمالاً منجر به شکایت خواهد شد.

به نظر می رسد پاسخ Solomon نشان می دهد که مایکروسافت و شاید دیگر شرکت های هوش مصنوعی معتقدند هر چیزی که در اینترنت یافت می شود را می توان برای آموزش مدل ها استفاده کرد و این شرکت ها مجبور نیستند به سازندگان آن محتوا پول پرداخت کنند. این اختلاف احتمالاً در ماه ها و سال های آینده به پرونده های حقوقی بیشتری منجر خواهد شد.

طبق گزارشی که هفته گذشته منتشر شد، استارت‌آپ TollBit می‌گوید که به نظر می‌رسد بسیاری از شرکت‌های هوش مصنوعی پروتکل امنیتی سایت‌ها را که برای جلوگیری از استخراج محتوایشان استفاده می‌شود دور می‌زنند. به نظر می رسد شرکت های بزرگ OpenAI و Anthropic نیز از این پروتکل ها عبور می کنند.

تبلیغات بنری

parseek به نقل از یستا