Artwork

محتوای ارائه شده توسط Brian Bakhtiari. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Brian Bakhtiari یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

EP02 | آیا محتوای هوش مصنوعی قابل ردیابی است؟

15:43
 
اشتراک گذاری
 

بایگانی مجموعه ها ("فیدهای غیر فعال" status)

When? This feed was archived on April 22, 2024 04:06 (1M ago). Last successful fetch was on October 29, 2023 18:08 (7M ago)

Why? فیدهای غیر فعال status. سرورهای ما، برای یک دوره پایدار، قادر به بازیابی یک فید پادکست معتبر نبوده اند.

What now? You might be able to find a more up-to-date version using the search function. This series will no longer be checked for updates. If you believe this to be in error, please check if the publisher's feed link below is valid and contact support to request the feed be restored or if you have any other concerns about this.

Manage episode 360045992 series 3465044
محتوای ارائه شده توسط Brian Bakhtiari. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Brian Bakhtiari یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

در این قسمت بپردازیم به اینکه آیا محتواهایی که با هوش مصنوعی و به خصوص این مدل های زبانی بزرگ مثل چت جی پی تی تولید می شوند، قابل شناسایی توسط موتور های جستجوگر هستند یا نه. یعنی اینکه آیا میشه یه جوری متوجه شد که اینها رو ماشین نوشته، و نه انسان؟
یکم راجع به این موضوع صحبت میکنیم، بعد نظر گوگل رو راجع به این داستان بررسی میکنیم
و دست آخر هم ابزار های موجود، چه برای بحث پلاجیاریزم، که در ادامه توضیح میدم، و چه برای تشخیص متن های تولید شده توسط هوش مصنوعی رو معرفی میکنیم
خوب، حالا چرا اصلا صحبت راجع به این قضیه اهمیت داره؟، یا شاید بهتره بگم فعلا اهمیت داره؟ بذارید چند تا مثال بزنم: مثلا کسانی مثل من که کار تولید محتوا هم میکنند، میخوان بدونن آیا این محتواهایی که توسط هوش مصنوعی تولید میکنند رو میتونن همینجوری بذارن توی اینترنت یا نه؟ حالا چه برای مشتری هاشون باشه، چه برای خودشون،… یا اینکه این محتواها میتونه به راحتی توسط مثلا گوگل شناسایی بشه و نه تنها شما رو در سرچ گوگل نشون نده، بلکه وب سایتتون هم شامل جریمه های گوگل بشه.
این یک دست از مشکلات بود. یا مثلا این قضیه در محافل علمی و دانشگاهی هم مهمه، اینکه این پایان نامه، یا این تکلیف دانشگاهی یا الان که دیگه حتی در سطح مدارس هم این موضوع مطرح شده، رو خود شخص نوشته یا ماشین تولید کرده؟ این امتحان های آنلاین رو فرد خودش فکر کرده یا داده ربات براش حل کرده؟
خلاصه اینم نوع دیگری از این دست چالش ها ست

این هم که اول کار گفتم فعلا و در حال حاضر این موضوعات مهمه، دلیلش اینه که حدس میزنم کل سیستم آموزشی و پژوهشی و تربیتی و تولید محتوا و خلاصه خیلی چیز ها، همگی در آینده نزدیک تغییر می کنند، یا بهتر بگم مجبور هستند متحول بشن و اون موقع دیگه شاید بحث بر سر اینکه فلان محتوا یا فلان کار کار توسط ربات انجام شده یا نه، دیگه خیلی موضوعیتی نداشته باشه

بگذریم، من یک بکگراند خیلی کوچیک راجع به تولید محتوا و اس ای او بگم و اونم اینکه یکی از چیزایی که مدت هاست موقع تولید محتوا و بارگذاری اون تو اینترنت مهم بوده و هست، بحث محتوا ربایی یا دستبرد فکری بود. در قالب کلیش یعنی اینکه شما اثری رو که متعلق به دیگرانه به اسم خودتون عرضه بکنید. حالا این قضیه اگر در حوزه ادبیات باشه، میشه دزدی ادبی، اگر در حوزه هنر باشد میشه سرقت هنری. در مورد تولید محتوا هم اینطوری هستش که شما یه مطلب جالبی رو تو اینترنت می بینید، بعد میایین اون مطلب رو حالا یا عینا یا با دستکاری در یک پلتفرم دیگه ای به اسم خودتون یا مشتری تون منتشر می کنید.
خوب گوگل روی این موضوع همیشه خیلی حساس بوده. بحث محتواهای مشابه، یا داپلیکیت کانتنت ها رو گوگل اصلا بر نمی تابه، کار درستی هم میکنه. و خوب قصد هم اینه که هم از صاحبان ایده و تولید کننده محتوا ها حمایت بشه، هم اینکه به خلق محتواهای ناب و اندیشه های تازه کمک بشه.
البته بازنشر یک محتوا در یک پلتفرم دیگه ممنوع نیست، اما به شرطی که شما رفرنس بدید به جایی که اون محتوا اولین بار خلق شده. مثلا میتونید از طریق یک تگی به نام کنونیکال در کد اچ تی ام ال خودتون ارجاع بدید به صفحه اصلی که فلان متن رو ازش برداشتید

اما این وسط، یک سری ابزار هایی هم درست شدن که کارشون تغییر محتوا های متنی بود، طوری که گوگل و بقیع موتور های جستجوگر متوجه نشن این متن کپی یک متن دیگه است. از مترادف کلمات استفاده میکردن، تقدم تاخر یک سری جملات رو عوض میکردن و مدل های پیشرفته ترشون هم که اصلا مفهوم رو میگرفتن و کلا به زبان دیگری اون مفهوم رو بیان میکردن، مثل کاری که جسپر مثلا انجام میده
خلاصه همینطور اینا پیشرفته تر میشدن، و مرتبط گوگل هم الگوریتم هاش رو آپدیت میکرد و پیداشون میکرد

الان ولی داستان یکم متفاوت شده. الان متن هایی که هوش مصنوعی تولید میکنه، مثل خروجی های چت جی پی تی، اگر نخوام بگم همشون، ولی اکثرشون اصلا مشکل محتوا ربایی ندارند. متن ها خیلی هم اورجینال و دست اول هستن، انگار که یک آدمی از نو نشسته راجع به یک موضوعی فکر کرده و نوشته.

اما اگر خواستید متنی که تولید شده رو چک کنید که مشابه اون وجود نداشته باشه، یک سری ابزار های پلاجیاریزم براش وجود داره مثل

https://www.grammarly.com/plagiarism-checker
https://smallseotools.com/plagiarism-checker
https://www.copyscape.com/plagiarism.php
https://www.copyscape.com/premium.php

و اما نظر گوگل رو هم در رابطه با محتواهای اتوماتیک تولید شده بدونیم
گوگل یک داکیومنتی داره که بهش میگن

Google Search's guidance about AI-generated content
https://developers.google.com/search/blog/2023/02/google-search-and-ai-content

حرف کلی اینه که ما با محتوا های توسط هوش مصنوعی مشکلی نداریم تا زمانی که برای اهداف منیپولیت کردن یا دستکاری کردن سرچ ازشون استفاده نشه، خلاصه نخواین باهاش گوگل رو گول بزنین
و اینکه محتواها کیفیت بالا داشته باشن، مخاطب رو اولویت اول خودشون بدونن و اورجینال باشن
Original, high-quality, people-first content

اما من از صحبت های آقای جان مولر که سرچ ادوکیت گوگل هستن اینجوری برداشت میکنم هنوز که خیلی هم دلشون با محتواهای تولید شده توسط هوش مصنوعی یکی نیست. پارسال که اصلا میگفتن اینا اسپم هستن و جریمه می شوید و اینا
بعد از چت جی چی تی یکم لحنشون ملایم تر شده ولی هنوز هم میخوان یه جوری این پیام رو بدن که نکنید این کار رو
من حالا یه سری از مصاحبه ها و توییت های ایشون رو براتون پست میکنم تو این داکیومنتی که قراره آماده بکنم

این هم بهترین ابزار های موجود برای تشخیص اینکه آیا متنی توسط هوش مصنوعی نوشته شده یا خیر

https://openai-openai-detector.hf.space/
https://writer.com/ai-content-detector/
https://copyleaks.com/ai-content-detector
https://contentatscale.ai/ai-content-detector/
https://originality.ai/

  continue reading

10 قسمت

Artwork
iconاشتراک گذاری
 

بایگانی مجموعه ها ("فیدهای غیر فعال" status)

When? This feed was archived on April 22, 2024 04:06 (1M ago). Last successful fetch was on October 29, 2023 18:08 (7M ago)

Why? فیدهای غیر فعال status. سرورهای ما، برای یک دوره پایدار، قادر به بازیابی یک فید پادکست معتبر نبوده اند.

What now? You might be able to find a more up-to-date version using the search function. This series will no longer be checked for updates. If you believe this to be in error, please check if the publisher's feed link below is valid and contact support to request the feed be restored or if you have any other concerns about this.

Manage episode 360045992 series 3465044
محتوای ارائه شده توسط Brian Bakhtiari. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Brian Bakhtiari یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

در این قسمت بپردازیم به اینکه آیا محتواهایی که با هوش مصنوعی و به خصوص این مدل های زبانی بزرگ مثل چت جی پی تی تولید می شوند، قابل شناسایی توسط موتور های جستجوگر هستند یا نه. یعنی اینکه آیا میشه یه جوری متوجه شد که اینها رو ماشین نوشته، و نه انسان؟
یکم راجع به این موضوع صحبت میکنیم، بعد نظر گوگل رو راجع به این داستان بررسی میکنیم
و دست آخر هم ابزار های موجود، چه برای بحث پلاجیاریزم، که در ادامه توضیح میدم، و چه برای تشخیص متن های تولید شده توسط هوش مصنوعی رو معرفی میکنیم
خوب، حالا چرا اصلا صحبت راجع به این قضیه اهمیت داره؟، یا شاید بهتره بگم فعلا اهمیت داره؟ بذارید چند تا مثال بزنم: مثلا کسانی مثل من که کار تولید محتوا هم میکنند، میخوان بدونن آیا این محتواهایی که توسط هوش مصنوعی تولید میکنند رو میتونن همینجوری بذارن توی اینترنت یا نه؟ حالا چه برای مشتری هاشون باشه، چه برای خودشون،… یا اینکه این محتواها میتونه به راحتی توسط مثلا گوگل شناسایی بشه و نه تنها شما رو در سرچ گوگل نشون نده، بلکه وب سایتتون هم شامل جریمه های گوگل بشه.
این یک دست از مشکلات بود. یا مثلا این قضیه در محافل علمی و دانشگاهی هم مهمه، اینکه این پایان نامه، یا این تکلیف دانشگاهی یا الان که دیگه حتی در سطح مدارس هم این موضوع مطرح شده، رو خود شخص نوشته یا ماشین تولید کرده؟ این امتحان های آنلاین رو فرد خودش فکر کرده یا داده ربات براش حل کرده؟
خلاصه اینم نوع دیگری از این دست چالش ها ست

این هم که اول کار گفتم فعلا و در حال حاضر این موضوعات مهمه، دلیلش اینه که حدس میزنم کل سیستم آموزشی و پژوهشی و تربیتی و تولید محتوا و خلاصه خیلی چیز ها، همگی در آینده نزدیک تغییر می کنند، یا بهتر بگم مجبور هستند متحول بشن و اون موقع دیگه شاید بحث بر سر اینکه فلان محتوا یا فلان کار کار توسط ربات انجام شده یا نه، دیگه خیلی موضوعیتی نداشته باشه

بگذریم، من یک بکگراند خیلی کوچیک راجع به تولید محتوا و اس ای او بگم و اونم اینکه یکی از چیزایی که مدت هاست موقع تولید محتوا و بارگذاری اون تو اینترنت مهم بوده و هست، بحث محتوا ربایی یا دستبرد فکری بود. در قالب کلیش یعنی اینکه شما اثری رو که متعلق به دیگرانه به اسم خودتون عرضه بکنید. حالا این قضیه اگر در حوزه ادبیات باشه، میشه دزدی ادبی، اگر در حوزه هنر باشد میشه سرقت هنری. در مورد تولید محتوا هم اینطوری هستش که شما یه مطلب جالبی رو تو اینترنت می بینید، بعد میایین اون مطلب رو حالا یا عینا یا با دستکاری در یک پلتفرم دیگه ای به اسم خودتون یا مشتری تون منتشر می کنید.
خوب گوگل روی این موضوع همیشه خیلی حساس بوده. بحث محتواهای مشابه، یا داپلیکیت کانتنت ها رو گوگل اصلا بر نمی تابه، کار درستی هم میکنه. و خوب قصد هم اینه که هم از صاحبان ایده و تولید کننده محتوا ها حمایت بشه، هم اینکه به خلق محتواهای ناب و اندیشه های تازه کمک بشه.
البته بازنشر یک محتوا در یک پلتفرم دیگه ممنوع نیست، اما به شرطی که شما رفرنس بدید به جایی که اون محتوا اولین بار خلق شده. مثلا میتونید از طریق یک تگی به نام کنونیکال در کد اچ تی ام ال خودتون ارجاع بدید به صفحه اصلی که فلان متن رو ازش برداشتید

اما این وسط، یک سری ابزار هایی هم درست شدن که کارشون تغییر محتوا های متنی بود، طوری که گوگل و بقیع موتور های جستجوگر متوجه نشن این متن کپی یک متن دیگه است. از مترادف کلمات استفاده میکردن، تقدم تاخر یک سری جملات رو عوض میکردن و مدل های پیشرفته ترشون هم که اصلا مفهوم رو میگرفتن و کلا به زبان دیگری اون مفهوم رو بیان میکردن، مثل کاری که جسپر مثلا انجام میده
خلاصه همینطور اینا پیشرفته تر میشدن، و مرتبط گوگل هم الگوریتم هاش رو آپدیت میکرد و پیداشون میکرد

الان ولی داستان یکم متفاوت شده. الان متن هایی که هوش مصنوعی تولید میکنه، مثل خروجی های چت جی پی تی، اگر نخوام بگم همشون، ولی اکثرشون اصلا مشکل محتوا ربایی ندارند. متن ها خیلی هم اورجینال و دست اول هستن، انگار که یک آدمی از نو نشسته راجع به یک موضوعی فکر کرده و نوشته.

اما اگر خواستید متنی که تولید شده رو چک کنید که مشابه اون وجود نداشته باشه، یک سری ابزار های پلاجیاریزم براش وجود داره مثل

https://www.grammarly.com/plagiarism-checker
https://smallseotools.com/plagiarism-checker
https://www.copyscape.com/plagiarism.php
https://www.copyscape.com/premium.php

و اما نظر گوگل رو هم در رابطه با محتواهای اتوماتیک تولید شده بدونیم
گوگل یک داکیومنتی داره که بهش میگن

Google Search's guidance about AI-generated content
https://developers.google.com/search/blog/2023/02/google-search-and-ai-content

حرف کلی اینه که ما با محتوا های توسط هوش مصنوعی مشکلی نداریم تا زمانی که برای اهداف منیپولیت کردن یا دستکاری کردن سرچ ازشون استفاده نشه، خلاصه نخواین باهاش گوگل رو گول بزنین
و اینکه محتواها کیفیت بالا داشته باشن، مخاطب رو اولویت اول خودشون بدونن و اورجینال باشن
Original, high-quality, people-first content

اما من از صحبت های آقای جان مولر که سرچ ادوکیت گوگل هستن اینجوری برداشت میکنم هنوز که خیلی هم دلشون با محتواهای تولید شده توسط هوش مصنوعی یکی نیست. پارسال که اصلا میگفتن اینا اسپم هستن و جریمه می شوید و اینا
بعد از چت جی چی تی یکم لحنشون ملایم تر شده ولی هنوز هم میخوان یه جوری این پیام رو بدن که نکنید این کار رو
من حالا یه سری از مصاحبه ها و توییت های ایشون رو براتون پست میکنم تو این داکیومنتی که قراره آماده بکنم

این هم بهترین ابزار های موجود برای تشخیص اینکه آیا متنی توسط هوش مصنوعی نوشته شده یا خیر

https://openai-openai-detector.hf.space/
https://writer.com/ai-content-detector/
https://copyleaks.com/ai-content-detector
https://contentatscale.ai/ai-content-detector/
https://originality.ai/

  continue reading

10 قسمت

همه قسمت ها

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع