DALL-E 101: คืออะไรและทำงานอย่างไร
เผยแพร่แล้ว: 2024-04-18DALL-E เป็นหนึ่งในแพลตฟอร์ม AI เชิงนวัตกรรมที่สร้างเส้นแบ่งระหว่างความคิดสร้างสรรค์ที่มนุษย์และคอมพิวเตอร์สร้างขึ้น ต่อไปนี้เป็นภาพรวมของ DALL-E วิธีใช้งาน และสิ่งที่คุณควรรู้เพื่อให้ใช้ได้ผลสำหรับคุณ
สารบัญ
- DALL-E คืออะไร?
- ใครเป็นผู้สร้าง DALL-E?
- วิวัฒนาการของ DALL-E
- DALL-E ทำงานอย่างไร
- DALL-E ฟรีหรือไม่
- วิธีการใช้งาน DALL-E
- กรณีการใช้งานและแอปพลิเคชัน
- ประโยชน์ของ DALL-E
- ข้อบกพร่องของ DALL-E
- บทสรุป
DALL-E คืออะไร?
DALL-E เป็นแพลตฟอร์ม AI เจนเนอเรชั่นที่เปลี่ยนข้อความแจ้งเป็นรูปภาพ DALL-E สามารถประมวลผลภาษาธรรมชาติได้ ดังนั้นคุณไม่จำเป็นต้องมีการเขียนโค้ดหรือความสามารถในการแก้ไขภาพพิเศษใดๆ เพื่อใช้งาน คุณสามารถป้อนข้อความแจ้งที่อธิบายหัวเรื่อง สไตล์ กรอบ และคุณลักษณะอื่นๆ ของภาพที่คุณต้องการ จากนั้น DALL-E จะสร้างการแสดงภาพที่ตรงกับคำอธิบายของคุณ นอกจากนี้ยังสามารถแก้ไขภาพที่มีอยู่ได้
ชื่อ DALL-E ได้รับแรงบันดาลใจจากการรวมกันของชื่อของบุคคลที่มีชื่อเสียงสองคน ได้แก่ Salvador Dali ศิลปินเซอร์เรียลลิสต์ชาวสเปน และ WALL-E ซึ่งเป็นหุ่นยนต์ในภาพยนตร์พิกซาร์ปี 2008 ที่มีชื่อเดียวกัน
ใครเป็นผู้สร้าง DALL-E
OpenAI ซึ่งเป็นบริษัทเดียวกับที่อยู่เบื้องหลัง ChatGPT ได้สร้าง DALL-E OpenAI เป็นบริษัทวิจัย AI ที่ก่อตั้งในปี 2558
Open AI เปิดตัว DALL-E ในเดือนมกราคม 2021 เปิดตัว DALL-E 2 ในเดือนกันยายน 2022 และ DALL-E 3 ในเดือนตุลาคม 2023
DALL-E พัฒนาไปอย่างไร?
OpenAI ประกาศเครื่องมือสร้างภาพตัวแรกในปี 2020 และ DALL-E ก็ได้พัฒนาต่อจากนั้น การโจมตีครั้งแรกของ OpenAI ในการสร้างภาพเรียกว่า Image GPT Image GPT เป็นข้อพิสูจน์แรกว่าโมเดล GPT สามารถสร้างรูปภาพได้
จากนั้นก็มา DALL-E การทำซ้ำครั้งแรกของ DALL-E ขึ้นอยู่กับเวอร์ชันของ GPT-3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่ OpenAI เปิดตัวในปี 2020 ซึ่งปรับให้เหมาะกับการสร้างภาพ
DALL-E สร้างภาพที่น่าเชื่อถือและทำงานหลายอย่างให้สำเร็จ ซึ่งบางงานได้แก่:
- การปรับเปลี่ยนคุณลักษณะหลายประการของวัตถุ เช่น สีและพื้นผิวของทรงกลม
- ทำความเข้าใจการจัดเฟรม เช่น ภาพระยะใกล้และมุมกว้าง
- การสร้างภาพของวัตถุเดียวกันจากหลายมุม
- ทำความเข้าใจข้อมูลทางภูมิศาสตร์และช่วงเวลาในประวัติศาสตร์
DALL-E 2 คืออะไร?
เวอร์ชันถัดไป DALL-E 2 สร้างภาพที่มีความละเอียดสูงกว่าภาพที่สร้างโดย DALL-E ถึงสี่เท่า โดยจะจัดการองค์ประกอบและการจัดวางวัตถุได้อย่างมีประสิทธิภาพมากขึ้น ทำให้องค์ประกอบต่างๆ เช่น เงาและแสงดูสมจริงยิ่งขึ้น DALL-E 2 ยังแนะนำคุณสมบัติใหม่สองประการสำหรับการแก้ไขภาพที่มีอยู่: การลงสีและการลงสีภายนอก
- การลงสีคือการที่คุณลบส่วนหนึ่งของภาพและใช้ AI เพื่อเติมสิ่งอื่นลงในช่องว่าง ตัวอย่างเช่น คุณสามารถลบสิ่งปลูกสร้างออกจากพื้นหลังของรูปภาพและแทนที่ด้วยต้นไม้ได้
- การทาสีภายนอกคือการที่คุณขยายขอบเขตของภาพด้วย AI ตัวอย่างเช่น หากคุณมีภาพสุนัขของคุณในระยะใกล้ในสวนสาธารณะ และต้องการขยายภาพให้แสดงเส้นขอบฟ้าของเมืองในระยะไกล DALL-E 2 จะทำสิ่งนั้นด้วยการทาสีภายนอก
DALL-E 3 คืออะไร?
DALL-E 3 เป็นการปรับปรุงที่สำคัญกว่ารุ่นก่อนในหลายประการ สำหรับผู้เริ่มต้น ตีความข้อความแจ้งได้ดีกว่า เวอร์ชันก่อนหน้าจะข้ามคำและคำอธิบาย คุณต้องเก่งด้านวิศวกรรมทันทีเพื่อให้ได้ภาพที่คุณต้องการ DALL-E 3 เข้าใจความแตกต่างและบริบทได้ดีขึ้น และสามารถปฏิบัติตามคำแนะนำที่ซับซ้อนมากขึ้นได้ การตอบสนองแม่นยำยิ่งขึ้น และรูปภาพก็สอดคล้องกันยิ่งขึ้น ท้ายที่สุดผลลัพธ์จะสอดคล้องกับสิ่งที่ผู้คนต้องการได้ดีขึ้น
DALL-E 3 ยังมีมาตรการรักษาความปลอดภัยที่ซับซ้อนมากขึ้นอีกด้วย เช่น ป้องกันรูปภาพที่โจ่งแจ้ง ก้าวร้าว หรือเลือกปฏิบัติ เพื่อป้องกันไม่ให้ผู้คนสร้างภาพที่ละเมิดลิขสิทธิ์และละเมิดทรัพย์สินทางปัญญา DALL-E 3 จะไม่สร้างภาพที่มีลักษณะคล้ายกับบุคคลสาธารณะที่มีชีวิต หรือเลียนแบบสไตล์ของศิลปินและแบรนด์ยอดนิยม DALL-E 3 ยังช่วยให้ผู้สร้างสามารถเลือกไม่ใช้ภาพของตนเพื่อใช้ในการฝึกโมเดลในอนาคตได้
รวมกับเครื่องมือ AI ที่มีอยู่
DALL-E 3 รวมอยู่ใน ChatGPT และ Microsoft Image Creator จาก Designer (เดิมคือ Bing Image Generator)
ซึ่งหมายความว่าหากคุณสมัครสมาชิก ChatGPT แบบพรีเมียม คุณสามารถสร้างรูปภาพโดยเป็นส่วนหนึ่งของการสนทนากับแชทบอตได้ ด้วยความสามารถนี้ คุณไม่จำเป็นต้องเขียนข้อความแจ้งที่ตรงไปตรงมาเท่านั้น คุณสามารถถามคำถามหรือบอกเส้นทางได้ และ ChatGPT ก็สามารถมอบให้ DALL-E เพื่อสร้างภาพได้
ตัวอย่างเช่น คุณอาจจะพูดว่า “ฉันเพิ่งย้ายไปแอริโซนา และทุกคนเอาแต่พูดถึงสิ่งที่เรียกว่าฮาบูบ มันมีลักษณะอย่างไร?” ChatGPT สามารถประมวลผลคำถามของคุณและสร้างข้อความแจ้งสำหรับ DALL-E จากนั้น DALL-E จะสร้างภาพ Haboob ซึ่งเป็นพายุฝุ่นที่เกิดขึ้นในพื้นที่แห้งแล้งเช่นแอริโซนา
ChatGPT จะอธิบายรายละเอียดเกี่ยวกับข้อความแจ้งของคุณเพื่อแจ้งรายละเอียดเพิ่มเติมแก่ DALL-E หากคุณเขียนข้อความแจ้งว่า "สร้างภาพแมวสองตัวนั่งอยู่บนเก้าอี้ในสไตล์การถ่ายภาพวินเทจ" ChatGPT อาจปรับปรุงข้อความแจ้งของคุณดังนี้: "สร้างภาพถ่ายวินเทจขาวดำของแมวสองตัวนั่งอยู่บน เก้าอี้โซฟาสีเขียว แมวตัวหนึ่งเป็นแมวลาย และอีกตัวเป็นสีเทาทั่วตัว แมวสองตัวนั่งเคียงข้างกัน”
DALL-E ทำงานอย่างไร
ในระดับพื้นฐาน DALL-E ใช้การเรียนรู้เชิงลึกเพื่อทำความเข้าใจความสัมพันธ์ระหว่างรูปภาพและข้อความ ทำให้แบบจำลองสามารถแสดงรูปภาพใหม่สำหรับข้อความแจ้งได้ โมเดล AI เชิงสร้างสรรค์เฉพาะที่อยู่เบื้องหลัง DALL-E มีการพัฒนาอย่างต่อเนื่อง
ดอล-อี 1
DALL-E 1 (หรือที่เรียกว่า DALL-E) ใช้เวอร์ชันของ GPT-3 ซึ่งเป็น LLM ของ OpenAI ซึ่งได้รับการฝึกฝนให้สร้างรูปภาพจากคำอธิบายข้อความ โมเดลนี้มีพื้นฐานมาจากสถาปัตยกรรมหม้อแปลงไฟฟ้า เช่นเดียวกับที่ ChatGPT สร้างข้อความโดยการทำนายแต่ละคำ DALL-E เวอร์ชันดั้งเดิมก็สร้างภาพโดยการทำนายแต่ละพิกเซล
DALL-E 1 สร้างเอาต์พุตตัวเลือกจำนวนมากสำหรับพร้อมท์เดียว ระบบ AI ตัวที่สองที่เรียกว่า CLIP (Contrastive Language-Image Pretraining) ถูกนำมาใช้เพื่อเลือกระบบที่ดีที่สุด CLIP เช่นเดียวกับ DALL-E 1 ที่ได้รับการฝึกบนชุดข้อมูลรูปภาพและคำอธิบายภาพขนาดใหญ่ อย่างไรก็ตาม เป้าหมายของ CLIP คือการทำความเข้าใจว่ารูปภาพและคำอธิบายภาพที่เกี่ยวข้องกันมีความเกี่ยวข้องกันมากเพียงใด
ดัล-อี 2
DALL-E 2 สร้างภาพโดยใช้แบบจำลองการแพร่กระจายแทนที่จะเป็น LLM เพื่อปรับปรุงคุณภาพและความแม่นยำของภาพ
วิธีการนี้จะฝึกโมเดลให้ถ่ายภาพที่มีจุดรบกวน โดยที่พิกเซลมีการบิดเบี้ยวแบบสุ่ม และขจัดจุดรบกวนออกทีละน้อยเพื่อให้เห็นภาพที่ชัดเจน จากนั้น คุณสามารถให้ชุดพิกเซลบวกสัญญาณรบกวนแก่โมเดล ซึ่งแสดงถึงคุณลักษณะบางอย่างของรูปภาพที่ซ่อนอยู่ เช่น “แมวสวมหมวกทรงสูง” และโมเดลจะสร้างรูปภาพใหม่ตั้งแต่ต้น
DALL-E 2 ใช้ CLIP เพื่อทำความเข้าใจข้อความในข้อความแจ้งของผู้ใช้ และจับคู่ข้อความกับคุณลักษณะรูปภาพ ข้อมูลนี้จะถูกส่งผ่านไปยังโมเดลการแพร่กระจาย ทำให้สามารถสร้างเอาต์พุตที่เหมาะกับความต้องการของผู้ใช้ได้
ดัล-อี 3
ไม่ค่อยมีใครทราบเกี่ยวกับความแตกต่างทางสถาปัตยกรรมระหว่าง DALL-E 2 และ DALL-E 3 เนื่องจาก OpenAI ไม่ได้เปิดเผยข้อมูลนี้ต่อสาธารณะ อย่างไรก็ตาม DALL-E 3 เกือบจะใช้แบบจำลองการแพร่กระจาย เนื่องจากเป็นที่ยอมรับกันอย่างกว้างขวางว่าเป็นเทคนิคที่ล้ำสมัยในการสร้างภาพ
มีการคาดเดาว่า DALL-E 3 ใช้เทคนิคการแพร่กระจายขั้นสูงกว่า และอาจใช้ LLM (แทนที่จะเป็นโมเดลขนาดเล็กเช่น CLIP) เพื่อทำความเข้าใจความสัมพันธ์ระหว่างรูปภาพและข้อความ
DALL-E ใช้งานได้ฟรีหรือไม่
DALL-E ใช้งานได้กับการสมัครสมาชิก ChatGPT แบบชำระเงิน ซึ่งมีให้บริการหลายระดับสำหรับบุคคลและธุรกิจ
คุณสามารถเข้าถึง DALL-E ได้ฟรีด้วย Microsoft Image Creator จาก Designer (เดิมคือ Bing Image Generator) Image Creator ยังมีให้บริการผ่าน Copilot ซึ่งเป็นแชทบอทของ Microsoft
เคล็ดลับการใช้ DALL-E
เคล็ดลับบางประการในการได้รับผลลัพธ์ที่ดีที่สุดด้วย DALL-E:
มีคำอธิบาย
ยิ่งคำสั่งของคุณแม่นยำมากขึ้น เอาต์พุตของ DALL-E ก็จะยิ่งดีขึ้นเท่านั้น
- อธิบายหัวข้อหลักให้ชัดเจน ตัวอย่างเช่น "โซฟาไมโครไฟเบอร์สีน้ำเงิน" แทนที่จะเป็นเพียง "โซฟา"
- อธิบายสถานที่ เช่น “บนชายหาดเขตร้อน” “ในบ้านช่วงปี 1970” หรือ “ในโรงยิมของโรงเรียนประถม”
- ให้รายละเอียดการกระทำใดๆ เช่น "พระอาทิตย์ตกดิน" "สุนัขกำลังงีบหลับ" หรือ "ว่าวกำลังบิน"
- อธิบายรูปแบบภาพ เช่น “เหมือนจริง” “ภาพวาด” หรือ “ภาพร่างด้วยดินสอ”
- บอก DALL-E ว่าคุณต้องการสไตล์ไหน ตัวอย่างเช่น "ขาวดำ" "นามธรรม" หรือ "อาร์ตเดโค"
- รวมมุมกล้องและระยะโฟกัส เช่น "มุมมองทางอากาศ" "ระยะใกล้" หรือ "มุมกว้าง"
- ให้รายละเอียดการจัดแสง เช่น “เงาลึก” “แฟลช” หรือ “ย้อนแสง”
- อธิบายอารมณ์; ตัวอย่างเช่น “โรแมนติก” “กล้าหาญ” หรือ “ชวนฝัน”
เป็นคนทดลอง
ไม่มีตำราเรียนหรือวิธีที่สมบูรณ์แบบในการใช้ DALL-E วิธีที่ดีที่สุดเพื่อให้ได้ผลลัพธ์ที่คุณต้องการคือการใช้วิธีการทดลองเพื่อใช้งาน
- ปรับเปลี่ยนคำแนะนำของคุณเล็กน้อยเพื่อดูว่าคุณจะได้ผลลัพธ์ที่ดีขึ้นหรือไม่ ลองใช้คำเดียวกันหลายๆ รูปแบบเพื่อดูว่าจะเปลี่ยนผลลัพธ์ของคุณหรือไม่
- ค้นหาสมดุลของรายละเอียดที่เหมาะสม หากการแจ้งของคุณมีรายละเอียดมากเกินไป DALL-E อาจไม่ทราบว่าข้อใดที่สำคัญที่สุด ลองเล่นกับความซับซ้อนของการแจ้งเตือนเพื่อค้นหาจุดที่น่าสนใจของคุณ
- รั้งสำหรับความผิดพลาดและความล้มเหลว DALL-E สามารถออกนอกเส้นทางได้ เอาแต่ละคำตอบที่ล้มเหลวเป็นโอกาสในการเรียนรู้ การค้นหาว่าอะไรไม่ได้ผลมีความสำคัญพอๆ กับการค้นหาว่าอะไรได้ผล
กรณีการใช้งานและแอปพลิเคชันของ DALL-E
ผู้คนใช้ DALL-E สำหรับแอปพลิเคชันจำนวนมากในธุรกิจและส่วนบุคคล
การสื่อสารการตลาดและธุรกิจ
- การสร้างภาพสำหรับบล็อก โพสต์บนโซเชียลมีเดีย และเว็บไซต์
- ออกแบบโฆษณา เช่น ใบปลิว โปสเตอร์
- การออกแบบโลโก้และองค์ประกอบของแบรนด์
- การสร้างภาพสต็อกที่ไม่ซ้ำใคร
- ออกแบบบรรจุภัณฑ์สินค้า
แนวความคิด
- การออกแบบผลิตภัณฑ์ทางกายภาพ
- การเรนเดอร์โมเดลสถาปัตยกรรม
- สร้างสรรค์โครงการสร้างสรรค์อื่นๆ เช่น แอนิเมชั่น สตอรี่บอร์ด และการออกแบบตกแต่งภายใน
- ทดสอบความคิดสร้างสรรค์ในรูปแบบต่างๆ
เนื้อหาทางการศึกษา
- การสร้างสื่อโสตทัศนูปกรณ์ เช่น อินโฟกราฟิก และไดอะแกรม
- พรรณนาถึงเหตุการณ์ทางประวัติศาสตร์
- การแสดงภาพกระบวนการทางวิทยาศาสตร์ที่คุณไม่สามารถมองเห็นด้วยตาเปล่า เช่น ปฏิกิริยาทางเคมี
- การสร้างภาพที่ปรับให้เหมาะกับความต้องการ ความสนใจ หรือสไตล์การเรียนรู้ของนักเรียนแต่ละคน
ศิลปะและการออกแบบ
- การสร้างงานศิลปะแบบกำหนดเองสำหรับการตกแต่งบ้านหรืองานปาร์ตี้ของคุณ
- การออกแบบปกหนังสือ อัลบั้ม หรือภาพยนตร์
- สร้างงานศิลปะเพื่อขายบนผลิตภัณฑ์ เช่น เสื้อยืด ที่คั่นหนังสือ และภาพพิมพ์
- การสร้างภาพอ้างอิงเพื่อใช้เป็นแรงบันดาลใจสำหรับสื่อศิลปะอื่นๆ เช่น การออกแบบแฟชั่น
- การออกแบบองค์ประกอบ เช่น พื้นผิวพื้นหลัง เพื่อรวมเข้ากับงานศิลปะรูปแบบอื่นๆ
การแก้ไขภาพที่มีอยู่
- การเพิ่มหัวเรื่องให้กับรูปภาพ
- การปรับพื้นหลัง
- การเปลี่ยนอัตราส่วนภาพ
- เน้นวัตถุบางอย่าง
- การลบวัตถุออกและแทนที่ด้วยวัตถุอื่น
ประโยชน์ของการใช้ DALL-E
DALL-E มีข้อได้เปรียบมากมาย รวมถึงความสามารถในการเลือกการตอบสนองที่หลากหลาย ใช้แพลตฟอร์มควบคู่ไปกับเครื่องมือ AI อื่นๆ และขจัดอุปสรรคในงานศิลปะและการออกแบบ
สร้างภาพหลายภาพต่อข้อความแจ้ง
DALL-E สร้างภาพสี่ภาพต่อการแจ้งเตือน ดังนั้นคุณจึงสามารถเลือกภาพที่เหมาะกับความต้องการของคุณได้มากที่สุด โดยจะปรับเปลี่ยนพรอมต์เล็กน้อยสำหรับแต่ละภาพและขยายออกเพื่อเพิ่มรายละเอียดเพิ่มเติม
ตัวอย่างเช่น หากคุณป้อนข้อความแจ้งทั่วไป เช่น “ภาพสไตล์หนังสือการ์ตูนในตรอกมืด” DALL-E จะใช้ข้อความแจ้งของคุณใหม่และเพิ่มรายละเอียด เช่น รูปแบบของอาคารในฉาก การวางกรอบของภาพ หรือ สีที่โดดเด่น คุณสามารถดูรูปแบบต่างๆ ของ DALL-E ได้โดยคลิกที่ภาพแต่ละภาพ
ผสานรวมกับ ChatGPT และ Microsoft Copilot
คุณสามารถเข้าถึง DALL-E ผ่านทางแชทบอทที่คุณอาจใช้อยู่แล้ว สะดวกในการสร้างข้อความและรูปภาพทั้งหมดภายในเครื่องมือเดียว นอกจากนี้ เนื่องจากสิ่งเหล่านี้เป็นแชทบอท รูปภาพที่คุณสร้างจึงสามารถเป็นส่วนหนึ่งของการสนทนาที่ยาวนานขึ้นได้
ตัวอย่างเช่น สมมติว่าคุณใช้ ChatGPT เพื่อสร้างกำหนดการสำหรับงานเลี้ยงรับขวัญเด็ก ในกรณีนั้น คุณยังสามารถใช้ DALL-E เพื่อสร้างรูปภาพสำหรับบัตรเชิญได้ เนื่องจากเป็นส่วนหนึ่งของการสนทนาเดียว ChatGPT จึงสามารถรวมรายละเอียดบางส่วนของวาระการประชุมของคุณไว้ในคำเชิญได้
ทำให้การออกแบบเข้าถึงได้มากขึ้น
ซอฟต์แวร์การออกแบบและอุปกรณ์การถ่ายภาพอาจมีราคาแพงและท้าทายในการเรียนรู้ DALL-E ทำให้การสร้างภาพเข้าถึงได้ง่ายขึ้นสำหรับคนทั่วไป
- เจ้าของธุรกิจขนาดเล็กสามารถสร้างทรัพย์สินของแบรนด์ที่กำหนดเองได้ เช่น รูปภาพและรูปภาพผลิตภัณฑ์ซึ่งก่อนหน้านี้จะเข้าถึงไม่ได้
- ผู้ที่ชื่นชอบงานอดิเรกในด้านต่างๆ เช่น งานไม้และการแกะสลักสามารถร่างภาพแนวคิดของตนเองได้โดยไม่ต้องลงทุนในซอฟต์แวร์ราคาแพง
- ผู้คนและองค์กรจากกลุ่มที่ด้อยโอกาสหรือมีงานอดิเรกเฉพาะกลุ่มสามารถสร้างภาพที่ตรงกับความสนใจของพวกเขาได้
ข้อบกพร่องของ DALL-E
แม้จะมีความสามารถ แต่ DALL-E ก็มีข้อจำกัดบางประการ
ความคาดเดาไม่ได้
เนื่องจาก DALL-E สร้างภาพทุกภาพตั้งแต่เริ่มต้น จึงไม่อาจคาดเดาได้ สมมติว่าคุณมีข้อกำหนดเฉพาะสำหรับการจัดวางวัตถุหรือมาตรฐานแบรนด์ ในกรณีดังกล่าว DALL-E อาจไม่รวมมาตรฐานเหล่านั้นไว้ในผลลัพธ์เสมอไป
นอกจากนี้ การปรับข้อความแจ้งของคุณเล็กน้อยอาจส่งผลให้ผลลัพธ์แตกต่างออกไปอย่างมาก นี่เป็นเรื่องท้าทายอย่างยิ่งเมื่อเปลี่ยนภาพที่ DALL-E สร้างขึ้นแล้ว
อคติ
AI เชิงสร้างสรรค์ทั้งหมดเกี่ยวข้องกับอคติ และ DALL-E ก็ไม่ต่างกัน DALL-E อยู่ภายใต้การสร้างการตอบสนองที่สะท้อนถึงอคติเกี่ยวกับเชื้อชาติ เพศ ชนชั้น และแม้แต่บางภาษาหรือบางประเทศ DALL-E ได้รับการฝึกอบรมเกี่ยวกับข้อมูลจากสหรัฐอเมริกาเป็นหลัก ดังนั้นจึงมักจะสะท้อนถึงวัฒนธรรม ค่านิยม และอคติของชาวอเมริกัน
การใช้คำคุณศัพท์บางคำอาจนำไปสู่ผลลัพธ์ที่เหมารวม ตัวอย่างเช่น หากข้อความแจ้งมีคำ เช่น เกี่ยวกับอารมณ์หรือละเอียดอ่อนผลลัพธ์ที่ได้อาจเกี่ยวข้องกับผู้หญิง ในขณะเดียวกัน คำพูดเช่นรุนแรงหรือสติปัญญาอาจนำไปสู่ผลลัพธ์ที่มีลักษณะเป็นผู้ชาย
ค่าใช้จ่าย
DALL-E มีค่าใช้จ่าย เว้นแต่คุณจะใช้ Microsoft Image Creator ซึ่งอาจไม่สะดวก ขึ้นอยู่กับความต้องการของคุณ
หากคุณต้องการใช้ ChatGPT บนแพลตฟอร์ม AI ของ Microsoft คุณจะต้องจ่ายเงินเพื่อเข้าถึง DALL-E
อะไรต่อไปสำหรับการสร้างภาพ DALL-E และ AI
คุณสามารถใช้ DALL-E เพื่อกระตุ้นการระดมความคิดเชิงสร้างสรรค์ ปรับปรุงกระบวนการออกแบบ หรือเพียงแค่สนุกสนาน เป็นหนึ่งในแพลตฟอร์ม AI เจนเนอเรชั่นจำนวนมากที่ช่วยให้คุณสามารถสร้างในรูปแบบใหม่ๆ ได้ เนื่องจากผสานรวมกับแพลตฟอร์ม AI ที่มีอยู่ เช่น ChatGPT และ Microsoft Image Creator คุณจึงสร้างรูปภาพและสร้างข้อความได้ทั้งหมดภายในเครื่องมือเดียว
เมื่อใช้ DALL-E สิ่งสำคัญคือต้องจำไว้ว่า AI ที่สร้างสรรค์ทั้งหมดมีแนวโน้มที่จะสร้างการตอบสนองแบบเอนเอียง การรู้ข้อจำกัดของ DALL-E ช่วยให้คุณค้นหาวิธีที่ดีที่สุดในการใช้งาน และรับภาพที่คุณต้องการ
ความสามารถ คุณสมบัติ และคู่แข่งใหม่ๆ เกิดขึ้นอย่างต่อเนื่อง ใครก็ตามที่ต้องการใช้ generative AI ไม่ว่าจะเพื่อธุรกิจ ส่วนตัว หรือเพื่อการศึกษา ควรติดตามการพัฒนาล่าสุด เราจะคอยพูดถึงการเปลี่ยนแปลงที่สำคัญใน Generative AI ต่อไป ดังนั้นติดตามบล็อก Grammarly เพื่อไม่พลาดข่าวสาร