هوش مصنوعی «آنتروپیک» میلیونها کتاب را نابود کرد

شرکت «آنتروپیک»(Anthropic) میلیونها کتاب را نابود کرد تا «هوش مصنوعی» خود را آموزش دهد.
عصر کانادا – سؤال بسیاری از افراد در این دوران که نوشتههای مختلف درباره نابودی بیوقفه هنرها توسط صنعت «هوش مصنوعی» صحبت میکند، این است که چطور «آنتروپیک» دادههای مورد نیاز برای آموزش مدل «کلود»(Claude) خود را جمعآوری کرده است.
به نقل از فیوچریسم، این استارتآپ پشتیبانی شده توسط گوگل، تنها از میلیونها کتاب دارای حق نشر تقلید نکرد، بلکه صفحات کتابها را از جلدشان جدا کرد، آنها را اسکن کرد تا فایلهای دیجیتال بسازد و سپس تمام آن میلیونها صفحه متن اصلی را دور ریخت. در واقع این «هوش مصنوعی»، این کتابها را بلعید.
این کار در دادگاه فاش شد. قاضی این پرونده حکم داد که «آنتروپیک» میتواند «مدلهای زبانی بزرگ»(LLM) خود را بر اساس کتابهایی که قانوناً خریده، حتی بدون اجازه مستقیم نویسندگان، آموزش دهد.
این شرکت تنها شرکتی نبوده است که این کار را انجام داده است، با این وجود به علت مقیاس عظیمش مورد توجه قرار گرفت.
این کار در مجموع، از مفهوم حقوقی «قاعده اولین فروش»(first-sale doctrine) بهره میبرد. این اصل به خریدار اجازه میدهد هر کاری میخواهد با کالای خریداریشده انجام دهد و نیاز به مداخله حقوقدان یا ناشر نیست، با این وجود کار شرکتهای «هوش مصنوعی» همیشه با نیت بد همراه بوده است.
«آنتروپیک» در فوریه ۲۰۲۴ (بهمن 1402)، «تام تروی»(Tom Turvey)، سرپرست پیشین پروژه اسکن کتابهای گوگل را استخدام کرد تا تمام کتابهای جهان را بدون روبهرو شدن با مشکل حقوقی، جمعآوری کند. «تروی» با خریدن کتابها به شکل فیزیکی منجر به محافظت این شرکت با قانون «قاعده اولین فروش» شد و این شرکت دیگر نیاز به دریافت مجوز ندارد.
جدا کردن صفحات، اسکن را ارزانتر و راحتتر میکرد، زیرا این شرکت تنها داخل شرکت از این نسخههای اسکنشده استفاده میکرد و پس از آن نسخهها را دور میانداخت. این کار به لحاظ حقوقی و قانونی، مجاز است.
البته این راهحل، کمی فریبکارانه و ریاکارانه است. زمانی که «آنتروپیک» شروع به کار کرد، مسیر غیر اخلاقیتری را انتخاب کرد و میلیونها کتاب را دانلود کرد و آنها را به صورت غیرقانونی برای آموزش «هوش مصنوعی» خودش استفاده کرد. همین کار را شرکت «متا»(Meta) نیز انجام داد که به تازگی توسط گروهی از نویسندگان در دادگاه مورد شکایت قرار گرفته است.
همچنین این کار با بیدقتی همراه است. بسیاری از آرشیوها و مؤسسات، روشهایی ابداع کردهاند تا بتوانند کتابها را به صورت گروهی اسکن کنند، بدون اینکه نیاز باشد آنها را نابود کنند یا تغییر دهند، اما هرچقدر که این امر صرفهجویی در هزینه باشد، صنعت «هوش مصنوعی» در حال کمبود منابع باکیفیت است که بتواند سامانههای خود را تغذیه کند و از آنجایی که در طول این مدت کم، کارهای غیراخلاقی انجام داده است، سرانجام اهمیتی ندارد که برخی نویسندگان ضرر ببینند یا کتابها نابود شوند. این هزینهای کوچک برای غولهای فناوری است که باید پرداخت شود.