شرکت مادر فیسبوک و اینستاگرام میگوید که فناوری تبدیل متن به گفتار مبتنی بر هوش مصنوعی را توسعه داده است که میتواند بیش از 4000 زبان را شناسایی کند. متا می گوید هدف حفظ زبان های جهان است و غول فناوری از کتاب مقدس و دیگر متون مذهبی برای انجام این کار استفاده می کند.
متا در مصاحبه ای گفت: “جمع آوری داده های صوتی برای هزاران زبان اولین چالش ما بود زیرا بزرگترین مجموعه داده گفتاری موجود حداکثر 100 زبان را پوشش می دهد.” پست اعلام پروژه برای غلبه بر این موضوع، به متون دینی مانند کتاب مقدس، که به زبانهای مختلف ترجمه شدهاند و ترجمههای آنها بهطور گستردهای برای تحقیقات ترجمه زبان مبتنی بر متن مورد مطالعه قرار گرفتهاند، روی آوردیم.»
در یک همراه مقاله تحقیقاتی توسط تیم اصلی Meta AI، این شرکت میگوید که دادههای خود را از کتاب مقدس، از جمله متن اصلی و ضبطهای صوتی از FaithComesByHearing.com، GoTo.Bible و Bible.com به دست آورده است.
این پروژه شامل ضبط داستان های کتاب مقدس، پیام های بشارتی، خواندن کتاب مقدس، و آهنگ ها به بیش از 6255 زبان و گویش است. در حالی که اکثر ویژگیهای ضبطشده اغلب توسط خوانندگان مرد انجام میشد، متا میگوید که مدلهای آن برای صداهای زنانه به همان اندازه خوب کار میکنند.
متا گفت که مجموعه ای از قرائت های عهد جدید بیش از 1100 زبان را ارائه می کند که به طور متوسط 32 ساعت داده برای هر زبان ارائه می کند.
با توجه به کالج Broward مرکز زبان لینگوا، بیش از 7100 زبان زنده در سراسر جهان وجود دارد.
تیم هوش مصنوعی متا گفت: «مشاورههای ما با اخلاقشناسان مسیحی به این نتیجه رسید که بیشتر مسیحیان عهد جدید و ترجمههای آن را مقدس نمیدانند و نمیتوانند در یادگیری ماشینی مورد استفاده قرار گیرند.
متا AI گفت: «همچنین خطر سوگیری دادههای آموزشی مذهبی مدلها با توجه به یک جهانبینی خاص وجود دارد». با این حال، تجزیه و تحلیل ما از زبان تولید شده توسط مدلهای ما نشان میدهد که زبان تولید شده توسط مدلهای تشخیص گفتار در مقایسه با مدلهای پایه آموزشدیده در حوزههای دیگر، تنها تعصب کمی از خود نشان میدهد.
پس از اینکه بلندپروازی های متا در اوایل سال جاری ناکام ماند، به نظر می رسد متا چنین کرده است تمرکز خود را تغییر داد به هوش مصنوعی، از جمله ساخت ابزار هوش مصنوعی برای شناسایی و جداسازی موارد در آن تصاویر و ابزاری با هوش مصنوعی برای کمک به برندها هدف کاربران در پلتفرم های فیس بوک و اینستاگرام آن.
در حالی که این فناوری هنوز در مراحل اولیه خود است، متا می گوید که داده ها و کدهای خود را منبع باز می کند تا دیگران بتوانند پلتفرم را توسعه دهند، توسعه دهند و بهبود بخشند.
متا گفت: «بسیاری از زبانهای جهان در خطر ناپدید شدن هستند و محدودیتهای فناوری تشخیص گفتار و تولید فعلی تنها این روند را تسریع میکند. ما میخواهیم دسترسی مردم به اطلاعات و استفاده از دستگاهها به زبان دلخواهشان را آسانتر کنیم و امروز مجموعهای از مدلهای هوش مصنوعی را معرفی میکنیم که میتواند به آنها در انجام این کار کمک کند.»