נתוני תיוג
תחקיר של מגזין TIME גילה כי על מנת לבנות מערכת אבטחה מפני תוכן רעיל (למשל, התעללות מינית, אלימות, גזענות, סקסיזם וכו'), OpenAI השתמשה בעובדים קנייתים שהשתכרו פחות מ-2 דולר לשעה כדי לתייג תוכן רעיל. תוויות אלו שימשו לאימון מודל לזיהוי תוכן כזה בעתיד. העובדים שהוצאו למיקור חוץ נחשפו לתוכן רעיל ומסוכן כה רב עד שתיארו את החוויה כ"עינויים". שותפת המיקור החוץ של OpenAI הייתה Sama, חברת נתוני הדרכה שבסיסה בסן פרנסיסקו, קליפורניה.
פריצת ג'יילס
ChatGPT מנסה לדחות הנחיות שעשויות להפר את מדיניות התוכן שלה. עם זאת, חלק מהמשתמשים הצליחו לפרוץ את ChatGPT באמצעות טכניקות שונות של הנדסת הנחיות כדי לעקוף את ההגבלות הללו בתחילת דצמבר 2022, והצליחו להערים על ChatGPT לתת הוראות כיצד ליצור בקבוק תבערה או פצצה גרעינית, או לייצר טיעונים בסגנון ניאו-נאצי. כתב של טורונטו סטאר הצליח באופן אישי לא אחיד לגרום ל-ChatGPT להשמיע הצהרות מסיתות זמן קצר לאחר ההשקה: ChatGPT הוטעה לתמוך בפלישה הרוסית לאוקראינה ב-2022, אך אפילו כאשר התבקש להצטרף לתרחיש בדיוני, ChatGPT נרתעה מיצירת טיעונים מדוע ראש ממשלת קנדה ג'סטין טרודו אשם בבגידה. (ויקי)
זמן פרסום: 18 בפברואר 2023