หุ่นยนต์กำลังสร้างภาพและเล่าเรื่องตลก 5 สิ่งที่ควรรู้เกี่ยวกับรุ่นพื้นฐานและ AI รุ่นต่อไป

หุ่นยนต์กำลังสร้างภาพและเล่าเรื่องตลก 5 สิ่งที่ควรรู้เกี่ยวกับรุ่นพื้นฐานและ AI รุ่นต่อไป

ระบบเหล่านี้เรียกว่า “รุ่นพื้นฐาน” และไม่ใช่การหลอกล่อและปาร์ตี้ทั้งหมด ดังนั้นวิธีการใหม่นี้สำหรับ AI ทำงานอย่างไร และมันจะเป็นจุดสิ้นสุดของความคิดสร้างสรรค์ของมนุษย์และจุดเริ่มต้นของฝันร้ายที่ลึกล้ำหรือไม่? โมเดลพื้นฐานทำงานโดยการฝึกระบบขนาดใหญ่เพียงระบบเดียวบนข้อมูลทั่วไปจำนวนมาก จากนั้นปรับระบบให้เข้ากับปัญหาใหม่ รุ่นก่อนหน้านี้มักจะเริ่มต้นจากศูนย์สำหรับแต่ละปัญหาใหม่

ตัวอย่างเช่น DALL-E 2 ได้รับการฝึกให้จับคู่รูปภาพ (เช่น รูปแมวเลี้ยง) 

โดยสแกนตัวอย่างหลายร้อยล้านตัวอย่าง เมื่อได้รับการฝึกฝน 

โมเดลนี้จะรู้ว่าแมว (และสิ่งอื่นๆ) มีลักษณะอย่างไรในรูปภาพ แต่โมเดลยังสามารถใช้กับงาน AI ที่น่าสนใจอื่นๆ ได้ เช่น การสร้างภาพใหม่จากคำอธิบายภาพเพียงอย่างเดียว (“ขอดูหมีโคอาล่าจุ่มลูกบาส”) หรือแก้ไขภาพตามคำแนะนำที่เป็นลายลักษณ์อักษร (“ทำให้ดูเหมือนลิงตัวนี้ ชำระภาษี”)

2. พวกเขาทำงานอย่างไร?

โมเดลพื้นฐานทำงานบน ” โครงข่ายประสาทส่วนลึก ” ซึ่งได้รับแรงบันดาลใจมาจากวิธีการทำงานของสมอง สิ่งเหล่านี้เกี่ยวข้องกับคณิตศาสตร์ที่ซับซ้อนและพลังการคำนวณจำนวนมหาศาล แต่พวกมันก็ลงเอยด้วยการจับคู่รูปแบบที่ซับซ้อนมาก

ตัวอย่างเช่น เมื่อดูภาพตัวอย่างหลายล้านภาพ โครงข่ายประสาทเทียมระดับลึกสามารถเชื่อมโยงคำว่า “แมว” กับรูปแบบของพิกเซลที่มักปรากฏในภาพแมว เช่น พื้นผิวที่นุ่ม ฟู ฟู มีขน ยิ่งโมเดลเห็นตัวอย่างมาก (ยิ่งแสดงข้อมูลมากขึ้น) และยิ่งโมเดลมีขนาดใหญ่ (ยิ่งมี “เลเยอร์” หรือ “ความลึก” มาก) รูปแบบและความสัมพันธ์เหล่านี้ก็จะยิ่งซับซ้อนมากขึ้นเท่านั้น ในแง่หนึ่ง โมเดลพื้นฐานเป็นเพียงส่วนเสริมของกระบวนทัศน์ “การเรียนรู้เชิงลึก” ที่ครอบงำการวิจัย AI ในช่วงทศวรรษที่ผ่านมา อย่างไรก็ตาม พวกมันแสดงพฤติกรรมที่ไม่ได้ตั้งโปรแกรมหรือ “เกิดขึ้นทันที” ซึ่งอาจทั้งน่าประหลาดใจและแปลกใหม่

ตัวอย่างเช่น โมเดลภาษา PaLM ของ Google ดูเหมือนจะสามารถสร้างคำอธิบายสำหรับคำอุปมาอุปไมยและเรื่องตลกที่ซับซ้อนได้ สิ่งนี้นอกเหนือไปจากแค่การเลียนแบบประเภทของข้อมูลที่ได้รับการฝึกฝนมาแต่เดิมให้ประมวลผล

ขนาดที่แท้จริงของระบบ AI เหล่านี้เป็นเรื่องยากที่จะนึกถึง PaLM 

มี พารามิเตอร์ 540 พันล้านพารามิเตอร์ หมายความว่าแม้ว่าทุกคนบนโลกจะจดจำตัวเลขได้ 50 ตัว เราก็ยังคงมีพื้นที่จัดเก็บไม่เพียงพอที่จะสร้างแบบจำลองขึ้นมาใหม่

แบบจำลองมีขนาดใหญ่มากจนการฝึกอบรมต้องใช้ทรัพยากรด้านการคำนวณและทรัพยากรอื่นๆ จำนวนมหาศาล ประมาณการหนึ่งระบุว่าค่าใช้จ่ายในการฝึก อบรมโมเดลภาษาของ OpenAI GPT-3 อยู่ที่ประมาณ 5 ล้านเหรียญสหรัฐ

ด้วยเหตุนี้ จึงมีเพียงบริษัทเทคโนโลยีขนาดใหญ่ เช่น OpenAI, Google และ Baidu เท่านั้นที่สามารถสร้างโมเดลพื้นฐานได้ในขณะนี้ บริษัทเหล่านี้จำกัดผู้ที่สามารถเข้าถึงระบบได้ ซึ่งสมเหตุสมผลทางเศรษฐกิจ

การจำกัดการใช้งานอาจทำให้เราสบายใจได้ว่าระบบเหล่านี้จะไม่ถูกนำไปใช้เพื่อจุดประสงค์ที่เลวร้าย (เช่น การสร้างข่าวปลอมหรือเนื้อหาที่ทำให้เสื่อมเสียชื่อเสียง) ในเร็วๆ นี้ แต่นี่ก็หมายความว่านักวิจัยอิสระไม่สามารถซักถามระบบเหล่านี้และแบ่งปันผลลัพธ์ในลักษณะที่เปิดเผยและรับผิดชอบได้ ดังนั้นเราจึงยังไม่ทราบความหมายทั้งหมดในการใช้งาน

4. โมเดลเหล่านี้จะมีความหมายอย่างไรสำหรับอุตสาหกรรม ‘สร้างสรรค์’

จะมีการผลิตรุ่นรองพื้นเพิ่มเติมในอีกไม่กี่ปีข้างหน้า โมเดลขนาดเล็กได้รับการเผยแพร่ในรูปแบบโอเพ่นซอร์สแล้ว บริษัทเทคโนโลยีกำลังเริ่มทดลองการให้สิทธิ์การใช้งานและการค้าเครื่องมือเหล่านี้และนักวิจัย AI กำลังทำงานอย่างหนักเพื่อทำให้เทคโนโลยีมีประสิทธิภาพและเข้าถึงได้มากขึ้น

ความคิดสร้างสรรค์อันน่าทึ่งที่แสดงโดยโมเดลต่างๆ เช่น PaLM และ DALL-E 2 แสดงให้เห็นว่างานสร้างสรรค์ระดับมืออาชีพอาจได้รับผลกระทบจากเทคโนโลยีนี้เร็วกว่าที่คาดไว้ในตอนแรก

ภูมิปัญญาดั้งเดิมกล่าวเสมอว่าหุ่นยนต์จะเข้ามาแทนที่งาน “ปกสีน้ำเงิน” ก่อน งาน “ปกขาว” ควรจะค่อนข้างปลอดภัยจากระบบอัตโนมัติ โดยเฉพาะงานระดับมืออาชีพที่ต้องใช้ความคิดสร้างสรรค์และการฝึกอบรม

โมเดล AI ที่เรียนรู้เชิงลึกได้แสดงความ แม่นยำเหนือมนุษย์อยู่แล้วในงานต่างๆ เช่นการตรวจสอบรังสีเอกซ์และการตรวจจับภาวะจอประสาทตาเสื่อม ในไม่ช้า โมเดลพื้นฐานอาจมอบความคิดสร้างสรรค์ราคาถูกที่ “ดีเพียงพอ” ในสาขาต่างๆ เช่น การโฆษณา การเขียนคำโฆษณา ภาพสต็อก หรือการออกแบบกราฟิก

อนาคตของการทำงานอย่างมืออาชีพและความคิดสร้างสรรค์อาจดูแตกต่างไปจากที่เราคาดไว้เล็กน้อย

5. สิ่งนี้หมายความว่าสำหรับหลักฐานทางกฎหมาย ข่าว และสื่อต่างๆ

โมเดลพื้นฐานจะส่งผลกระทบต่อกฎหมายอย่างหลีกเลี่ยงไม่ได้ในด้านต่างๆ เช่น ทรัพย์สินทางปัญญาและหลักฐานต่างๆ เนื่องจากเราไม่สามารถสันนิษฐานได้ว่าเนื้อหาที่สร้างสรรค์เป็นผลมาจากกิจกรรมของมนุษย์ นอกจากนี้ เรายังต้องเผชิญกับความท้าทายของการบิดเบือนข้อมูลและข้อมูลที่ผิดที่เกิดจากระบบเหล่านี้ เราเผชิญกับปัญหาใหญ่หลวงอยู่แล้วจากการบิดเบือนข้อมูล ดังที่เราเห็นในการเปิดโปงการรุกรานยูเครนของรัสเซียและปัญหาที่เพิ่งเกิดขึ้นของ ภาพและวิดีโอ ปลอมที่ลึกล้ำแต่โมเดลพื้นฐานก็พร้อมที่จะรับมือกับความท้าทายเหล่านี้

crdit : สล็อต 888 เว็บตรง ไม่ผ่านเอเย่นต์ ไม่มี ขั้นต่ำ / ดูหนังฟรี