DALL-E 101: คืออะไรและทำงานอย่างไร

เผยแพร่แล้ว: 2024-04-18

DALL-E เป็นหนึ่งในแพลตฟอร์ม AI เชิงนวัตกรรมที่สร้างเส้นแบ่งระหว่างความคิดสร้างสรรค์ที่มนุษย์และคอมพิวเตอร์สร้างขึ้น ต่อไปนี้เป็นภาพรวมของ DALL-E วิธีใช้งาน และสิ่งที่คุณควรรู้เพื่อให้ใช้ได้ผลสำหรับคุณ

สารบัญ

  • DALL-E คืออะไร?
  • ใครเป็นผู้สร้าง DALL-E?
  • วิวัฒนาการของ DALL-E
  • DALL-E ทำงานอย่างไร
  • DALL-E ฟรีหรือไม่
  • วิธีการใช้งาน DALL-E
  • กรณีการใช้งานและแอปพลิเคชัน
  • ประโยชน์ของ DALL-E
  • ข้อบกพร่องของ DALL-E
  • บทสรุป

DALL-E คืออะไร?

DALL-E เป็นแพลตฟอร์ม AI เจนเนอเรชั่นที่เปลี่ยนข้อความแจ้งเป็นรูปภาพ DALL-E สามารถประมวลผลภาษาธรรมชาติได้ ดังนั้นคุณไม่จำเป็นต้องมีการเขียนโค้ดหรือความสามารถในการแก้ไขภาพพิเศษใดๆ เพื่อใช้งาน คุณสามารถป้อนข้อความแจ้งที่อธิบายหัวเรื่อง สไตล์ กรอบ และคุณลักษณะอื่นๆ ของภาพที่คุณต้องการ จากนั้น DALL-E จะสร้างการแสดงภาพที่ตรงกับคำอธิบายของคุณ นอกจากนี้ยังสามารถแก้ไขภาพที่มีอยู่ได้

ชื่อ DALL-E ได้รับแรงบันดาลใจจากการรวมกันของชื่อของบุคคลที่มีชื่อเสียงสองคน ได้แก่ Salvador Dali ศิลปินเซอร์เรียลลิสต์ชาวสเปน และ WALL-E ซึ่งเป็นหุ่นยนต์ในภาพยนตร์พิกซาร์ปี 2008 ที่มีชื่อเดียวกัน

ทำงานอย่างชาญฉลาดยิ่งขึ้นด้วย Grammarly
คู่หูการเขียน AI สำหรับใครก็ตามที่มีงานทำ

ใครเป็นผู้สร้าง DALL-E

OpenAI ซึ่งเป็นบริษัทเดียวกับที่อยู่เบื้องหลัง ChatGPT ได้สร้าง DALL-E OpenAI เป็นบริษัทวิจัย AI ที่ก่อตั้งในปี 2558

Open AI เปิดตัว DALL-E ในเดือนมกราคม 2021 เปิดตัว DALL-E 2 ในเดือนกันยายน 2022 และ DALL-E 3 ในเดือนตุลาคม 2023

DALL-E พัฒนาไปอย่างไร?

OpenAI ประกาศเครื่องมือสร้างภาพตัวแรกในปี 2020 และ DALL-E ก็ได้พัฒนาต่อจากนั้น การโจมตีครั้งแรกของ OpenAI ในการสร้างภาพเรียกว่า Image GPT Image GPT เป็นข้อพิสูจน์แรกว่าโมเดล GPT สามารถสร้างรูปภาพได้

จากนั้นก็มา DALL-E การทำซ้ำครั้งแรกของ DALL-E ขึ้นอยู่กับเวอร์ชันของ GPT-3 ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่ OpenAI เปิดตัวในปี 2020 ซึ่งปรับให้เหมาะกับการสร้างภาพ

DALL-E สร้างภาพที่น่าเชื่อถือและทำงานหลายอย่างให้สำเร็จ ซึ่งบางงานได้แก่:

  • การปรับเปลี่ยนคุณลักษณะหลายประการของวัตถุ เช่น สีและพื้นผิวของทรงกลม
  • ทำความเข้าใจการจัดเฟรม เช่น ภาพระยะใกล้และมุมกว้าง
  • การสร้างภาพของวัตถุเดียวกันจากหลายมุม
  • ทำความเข้าใจข้อมูลทางภูมิศาสตร์และช่วงเวลาในประวัติศาสตร์

DALL-E 2 คืออะไร?

เวอร์ชันถัดไป DALL-E 2 สร้างภาพที่มีความละเอียดสูงกว่าภาพที่สร้างโดย DALL-E ถึงสี่เท่า โดยจะจัดการองค์ประกอบและการจัดวางวัตถุได้อย่างมีประสิทธิภาพมากขึ้น ทำให้องค์ประกอบต่างๆ เช่น เงาและแสงดูสมจริงยิ่งขึ้น DALL-E 2 ยังแนะนำคุณสมบัติใหม่สองประการสำหรับการแก้ไขภาพที่มีอยู่: การลงสีและการลงสีภายนอก

  • การลงสีคือการที่คุณลบส่วนหนึ่งของภาพและใช้ AI เพื่อเติมสิ่งอื่นลงในช่องว่าง ตัวอย่างเช่น คุณสามารถลบสิ่งปลูกสร้างออกจากพื้นหลังของรูปภาพและแทนที่ด้วยต้นไม้ได้
  • การทาสีภายนอกคือการที่คุณขยายขอบเขตของภาพด้วย AI ตัวอย่างเช่น หากคุณมีภาพสุนัขของคุณในระยะใกล้ในสวนสาธารณะ และต้องการขยายภาพให้แสดงเส้นขอบฟ้าของเมืองในระยะไกล DALL-E 2 จะทำสิ่งนั้นด้วยการทาสีภายนอก

DALL-E 3 คืออะไร?

DALL-E 3 เป็นการปรับปรุงที่สำคัญกว่ารุ่นก่อนในหลายประการ สำหรับผู้เริ่มต้น ตีความข้อความแจ้งได้ดีกว่า เวอร์ชันก่อนหน้าจะข้ามคำและคำอธิบาย คุณต้องเก่งด้านวิศวกรรมทันทีเพื่อให้ได้ภาพที่คุณต้องการ DALL-E 3 เข้าใจความแตกต่างและบริบทได้ดีขึ้น และสามารถปฏิบัติตามคำแนะนำที่ซับซ้อนมากขึ้นได้ การตอบสนองแม่นยำยิ่งขึ้น และรูปภาพก็สอดคล้องกันยิ่งขึ้น ท้ายที่สุดผลลัพธ์จะสอดคล้องกับสิ่งที่ผู้คนต้องการได้ดีขึ้น

DALL-E 3 ยังมีมาตรการรักษาความปลอดภัยที่ซับซ้อนมากขึ้นอีกด้วย เช่น ป้องกันรูปภาพที่โจ่งแจ้ง ก้าวร้าว หรือเลือกปฏิบัติ เพื่อป้องกันไม่ให้ผู้คนสร้างภาพที่ละเมิดลิขสิทธิ์และละเมิดทรัพย์สินทางปัญญา DALL-E 3 จะไม่สร้างภาพที่มีลักษณะคล้ายกับบุคคลสาธารณะที่มีชีวิต หรือเลียนแบบสไตล์ของศิลปินและแบรนด์ยอดนิยม DALL-E 3 ยังช่วยให้ผู้สร้างสามารถเลือกไม่ใช้ภาพของตนเพื่อใช้ในการฝึกโมเดลในอนาคตได้

รวมกับเครื่องมือ AI ที่มีอยู่

DALL-E 3 รวมอยู่ใน ChatGPT และ Microsoft Image Creator จาก Designer (เดิมคือ Bing Image Generator)

ซึ่งหมายความว่าหากคุณสมัครสมาชิก ChatGPT แบบพรีเมียม คุณสามารถสร้างรูปภาพโดยเป็นส่วนหนึ่งของการสนทนากับแชทบอตได้ ด้วยความสามารถนี้ คุณไม่จำเป็นต้องเขียนข้อความแจ้งที่ตรงไปตรงมาเท่านั้น คุณสามารถถามคำถามหรือบอกเส้นทางได้ และ ChatGPT ก็สามารถมอบให้ DALL-E เพื่อสร้างภาพได้

ตัวอย่างเช่น คุณอาจจะพูดว่า “ฉันเพิ่งย้ายไปแอริโซนา และทุกคนเอาแต่พูดถึงสิ่งที่เรียกว่าฮาบูบ มันมีลักษณะอย่างไร?” ChatGPT สามารถประมวลผลคำถามของคุณและสร้างข้อความแจ้งสำหรับ DALL-E จากนั้น DALL-E จะสร้างภาพ Haboob ซึ่งเป็นพายุฝุ่นที่เกิดขึ้นในพื้นที่แห้งแล้งเช่นแอริโซนา

ChatGPT จะอธิบายรายละเอียดเกี่ยวกับข้อความแจ้งของคุณเพื่อแจ้งรายละเอียดเพิ่มเติมแก่ DALL-E หากคุณเขียนข้อความแจ้งว่า "สร้างภาพแมวสองตัวนั่งอยู่บนเก้าอี้ในสไตล์การถ่ายภาพวินเทจ" ChatGPT อาจปรับปรุงข้อความแจ้งของคุณดังนี้: "สร้างภาพถ่ายวินเทจขาวดำของแมวสองตัวนั่งอยู่บน เก้าอี้โซฟาสีเขียว แมวตัวหนึ่งเป็นแมวลาย และอีกตัวเป็นสีเทาทั่วตัว แมวสองตัวนั่งเคียงข้างกัน”

DALL-E ทำงานอย่างไร

ในระดับพื้นฐาน DALL-E ใช้การเรียนรู้เชิงลึกเพื่อทำความเข้าใจความสัมพันธ์ระหว่างรูปภาพและข้อความ ทำให้แบบจำลองสามารถแสดงรูปภาพใหม่สำหรับข้อความแจ้งได้ โมเดล AI เชิงสร้างสรรค์เฉพาะที่อยู่เบื้องหลัง DALL-E มีการพัฒนาอย่างต่อเนื่อง

ดอล-อี 1

DALL-E 1 (หรือที่เรียกว่า DALL-E) ใช้เวอร์ชันของ GPT-3 ซึ่งเป็น LLM ของ OpenAI ซึ่งได้รับการฝึกฝนให้สร้างรูปภาพจากคำอธิบายข้อความ โมเดลนี้มีพื้นฐานมาจากสถาปัตยกรรมหม้อแปลงไฟฟ้า เช่นเดียวกับที่ ChatGPT สร้างข้อความโดยการทำนายแต่ละคำ DALL-E เวอร์ชันดั้งเดิมก็สร้างภาพโดยการทำนายแต่ละพิกเซล

DALL-E 1 สร้างเอาต์พุตตัวเลือกจำนวนมากสำหรับพร้อมท์เดียว ระบบ AI ตัวที่สองที่เรียกว่า CLIP (Contrastive Language-Image Pretraining) ถูกนำมาใช้เพื่อเลือกระบบที่ดีที่สุด CLIP เช่นเดียวกับ DALL-E 1 ที่ได้รับการฝึกบนชุดข้อมูลรูปภาพและคำอธิบายภาพขนาดใหญ่ อย่างไรก็ตาม เป้าหมายของ CLIP คือการทำความเข้าใจว่ารูปภาพและคำอธิบายภาพที่เกี่ยวข้องกันมีความเกี่ยวข้องกันมากเพียงใด

ดัล-อี 2

DALL-E 2 สร้างภาพโดยใช้แบบจำลองการแพร่กระจายแทนที่จะเป็น LLM เพื่อปรับปรุงคุณภาพและความแม่นยำของภาพ

วิธีการนี้จะฝึกโมเดลให้ถ่ายภาพที่มีจุดรบกวน โดยที่พิกเซลมีการบิดเบี้ยวแบบสุ่ม และขจัดจุดรบกวนออกทีละน้อยเพื่อให้เห็นภาพที่ชัดเจน จากนั้น คุณสามารถให้ชุดพิกเซลบวกสัญญาณรบกวนแก่โมเดล ซึ่งแสดงถึงคุณลักษณะบางอย่างของรูปภาพที่ซ่อนอยู่ เช่น “แมวสวมหมวกทรงสูง” และโมเดลจะสร้างรูปภาพใหม่ตั้งแต่ต้น

DALL-E 2 ใช้ CLIP เพื่อทำความเข้าใจข้อความในข้อความแจ้งของผู้ใช้ และจับคู่ข้อความกับคุณลักษณะรูปภาพ ข้อมูลนี้จะถูกส่งผ่านไปยังโมเดลการแพร่กระจาย ทำให้สามารถสร้างเอาต์พุตที่เหมาะกับความต้องการของผู้ใช้ได้

ดัล-อี 3

ไม่ค่อยมีใครทราบเกี่ยวกับความแตกต่างทางสถาปัตยกรรมระหว่าง DALL-E 2 และ DALL-E 3 เนื่องจาก OpenAI ไม่ได้เปิดเผยข้อมูลนี้ต่อสาธารณะ อย่างไรก็ตาม DALL-E 3 เกือบจะใช้แบบจำลองการแพร่กระจาย เนื่องจากเป็นที่ยอมรับกันอย่างกว้างขวางว่าเป็นเทคนิคที่ล้ำสมัยในการสร้างภาพ

มีการคาดเดาว่า DALL-E 3 ใช้เทคนิคการแพร่กระจายขั้นสูงกว่า และอาจใช้ LLM (แทนที่จะเป็นโมเดลขนาดเล็กเช่น CLIP) เพื่อทำความเข้าใจความสัมพันธ์ระหว่างรูปภาพและข้อความ

DALL-E ใช้งานได้ฟรีหรือไม่

DALL-E ใช้งานได้กับการสมัครสมาชิก ChatGPT แบบชำระเงิน ซึ่งมีให้บริการหลายระดับสำหรับบุคคลและธุรกิจ

คุณสามารถเข้าถึง DALL-E ได้ฟรีด้วย Microsoft Image Creator จาก Designer (เดิมคือ Bing Image Generator) Image Creator ยังมีให้บริการผ่าน Copilot ซึ่งเป็นแชทบอทของ Microsoft

เคล็ดลับการใช้ DALL-E

เคล็ดลับบางประการในการได้รับผลลัพธ์ที่ดีที่สุดด้วย DALL-E:

มีคำอธิบาย

ยิ่งคำสั่งของคุณแม่นยำมากขึ้น เอาต์พุตของ DALL-E ก็จะยิ่งดีขึ้นเท่านั้น

  • อธิบายหัวข้อหลักให้ชัดเจน ตัวอย่างเช่น "โซฟาไมโครไฟเบอร์สีน้ำเงิน" แทนที่จะเป็นเพียง "โซฟา"
  • อธิบายสถานที่ เช่น “บนชายหาดเขตร้อน” “ในบ้านช่วงปี 1970” หรือ “ในโรงยิมของโรงเรียนประถม”
  • ให้รายละเอียดการกระทำใดๆ เช่น "พระอาทิตย์ตกดิน" "สุนัขกำลังงีบหลับ" หรือ "ว่าวกำลังบิน"
  • อธิบายรูปแบบภาพ เช่น “เหมือนจริง” “ภาพวาด” หรือ “ภาพร่างด้วยดินสอ”
  • บอก DALL-E ว่าคุณต้องการสไตล์ไหน ตัวอย่างเช่น "ขาวดำ" "นามธรรม" หรือ "อาร์ตเดโค"
  • รวมมุมกล้องและระยะโฟกัส เช่น "มุมมองทางอากาศ" "ระยะใกล้" หรือ "มุมกว้าง"
  • ให้รายละเอียดการจัดแสง เช่น “เงาลึก” “แฟลช” หรือ “ย้อนแสง”
  • อธิบายอารมณ์; ตัวอย่างเช่น “โรแมนติก” “กล้าหาญ” หรือ “ชวนฝัน”

เป็นคนทดลอง

ไม่มีตำราเรียนหรือวิธีที่สมบูรณ์แบบในการใช้ DALL-E วิธีที่ดีที่สุดเพื่อให้ได้ผลลัพธ์ที่คุณต้องการคือการใช้วิธีการทดลองเพื่อใช้งาน

  • ปรับเปลี่ยนคำแนะนำของคุณเล็กน้อยเพื่อดูว่าคุณจะได้ผลลัพธ์ที่ดีขึ้นหรือไม่ ลองใช้คำเดียวกันหลายๆ รูปแบบเพื่อดูว่าจะเปลี่ยนผลลัพธ์ของคุณหรือไม่
  • ค้นหาสมดุลของรายละเอียดที่เหมาะสม หากการแจ้งของคุณมีรายละเอียดมากเกินไป DALL-E อาจไม่ทราบว่าข้อใดที่สำคัญที่สุด ลองเล่นกับความซับซ้อนของการแจ้งเตือนเพื่อค้นหาจุดที่น่าสนใจของคุณ
  • รั้งสำหรับความผิดพลาดและความล้มเหลว DALL-E สามารถออกนอกเส้นทางได้ เอาแต่ละคำตอบที่ล้มเหลวเป็นโอกาสในการเรียนรู้ การค้นหาว่าอะไรไม่ได้ผลมีความสำคัญพอๆ กับการค้นหาว่าอะไรได้ผล

กรณีการใช้งานและแอปพลิเคชันของ DALL-E

ผู้คนใช้ DALL-E สำหรับแอปพลิเคชันจำนวนมากในธุรกิจและส่วนบุคคล

การสื่อสารการตลาดและธุรกิจ

  • การสร้างภาพสำหรับบล็อก โพสต์บนโซเชียลมีเดีย และเว็บไซต์
  • ออกแบบโฆษณา เช่น ใบปลิว โปสเตอร์
  • การออกแบบโลโก้และองค์ประกอบของแบรนด์
  • การสร้างภาพสต็อกที่ไม่ซ้ำใคร
  • ออกแบบบรรจุภัณฑ์สินค้า

แนวความคิด

  • การออกแบบผลิตภัณฑ์ทางกายภาพ
  • การเรนเดอร์โมเดลสถาปัตยกรรม
  • สร้างสรรค์โครงการสร้างสรรค์อื่นๆ เช่น แอนิเมชั่น สตอรี่บอร์ด และการออกแบบตกแต่งภายใน
  • ทดสอบความคิดสร้างสรรค์ในรูปแบบต่างๆ

เนื้อหาทางการศึกษา

  • การสร้างสื่อโสตทัศนูปกรณ์ เช่น อินโฟกราฟิก และไดอะแกรม
  • พรรณนาถึงเหตุการณ์ทางประวัติศาสตร์
  • การแสดงภาพกระบวนการทางวิทยาศาสตร์ที่คุณไม่สามารถมองเห็นด้วยตาเปล่า เช่น ปฏิกิริยาทางเคมี
  • การสร้างภาพที่ปรับให้เหมาะกับความต้องการ ความสนใจ หรือสไตล์การเรียนรู้ของนักเรียนแต่ละคน

ศิลปะและการออกแบบ

  • การสร้างงานศิลปะแบบกำหนดเองสำหรับการตกแต่งบ้านหรืองานปาร์ตี้ของคุณ
  • การออกแบบปกหนังสือ อัลบั้ม หรือภาพยนตร์
  • สร้างงานศิลปะเพื่อขายบนผลิตภัณฑ์ เช่น เสื้อยืด ที่คั่นหนังสือ และภาพพิมพ์
  • การสร้างภาพอ้างอิงเพื่อใช้เป็นแรงบันดาลใจสำหรับสื่อศิลปะอื่นๆ เช่น การออกแบบแฟชั่น
  • การออกแบบองค์ประกอบ เช่น พื้นผิวพื้นหลัง เพื่อรวมเข้ากับงานศิลปะรูปแบบอื่นๆ

การแก้ไขภาพที่มีอยู่

  • การเพิ่มหัวเรื่องให้กับรูปภาพ
  • การปรับพื้นหลัง
  • การเปลี่ยนอัตราส่วนภาพ
  • เน้นวัตถุบางอย่าง
  • การลบวัตถุออกและแทนที่ด้วยวัตถุอื่น

ประโยชน์ของการใช้ DALL-E

DALL-E มีข้อได้เปรียบมากมาย รวมถึงความสามารถในการเลือกการตอบสนองที่หลากหลาย ใช้แพลตฟอร์มควบคู่ไปกับเครื่องมือ AI อื่นๆ และขจัดอุปสรรคในงานศิลปะและการออกแบบ

สร้างภาพหลายภาพต่อข้อความแจ้ง

DALL-E สร้างภาพสี่ภาพต่อการแจ้งเตือน ดังนั้นคุณจึงสามารถเลือกภาพที่เหมาะกับความต้องการของคุณได้มากที่สุด โดยจะปรับเปลี่ยนพรอมต์เล็กน้อยสำหรับแต่ละภาพและขยายออกเพื่อเพิ่มรายละเอียดเพิ่มเติม

ตัวอย่างเช่น หากคุณป้อนข้อความแจ้งทั่วไป เช่น “ภาพสไตล์หนังสือการ์ตูนในตรอกมืด” DALL-E จะใช้ข้อความแจ้งของคุณใหม่และเพิ่มรายละเอียด เช่น รูปแบบของอาคารในฉาก การวางกรอบของภาพ หรือ สีที่โดดเด่น คุณสามารถดูรูปแบบต่างๆ ของ DALL-E ได้โดยคลิกที่ภาพแต่ละภาพ

ผสานรวมกับ ChatGPT และ Microsoft Copilot

คุณสามารถเข้าถึง DALL-E ผ่านทางแชทบอทที่คุณอาจใช้อยู่แล้ว สะดวกในการสร้างข้อความและรูปภาพทั้งหมดภายในเครื่องมือเดียว นอกจากนี้ เนื่องจากสิ่งเหล่านี้เป็นแชทบอท รูปภาพที่คุณสร้างจึงสามารถเป็นส่วนหนึ่งของการสนทนาที่ยาวนานขึ้นได้

ตัวอย่างเช่น สมมติว่าคุณใช้ ChatGPT เพื่อสร้างกำหนดการสำหรับงานเลี้ยงรับขวัญเด็ก ในกรณีนั้น คุณยังสามารถใช้ DALL-E เพื่อสร้างรูปภาพสำหรับบัตรเชิญได้ เนื่องจากเป็นส่วนหนึ่งของการสนทนาเดียว ChatGPT จึงสามารถรวมรายละเอียดบางส่วนของวาระการประชุมของคุณไว้ในคำเชิญได้

ทำให้การออกแบบเข้าถึงได้มากขึ้น

ซอฟต์แวร์การออกแบบและอุปกรณ์การถ่ายภาพอาจมีราคาแพงและท้าทายในการเรียนรู้ DALL-E ทำให้การสร้างภาพเข้าถึงได้ง่ายขึ้นสำหรับคนทั่วไป

  • เจ้าของธุรกิจขนาดเล็กสามารถสร้างทรัพย์สินของแบรนด์ที่กำหนดเองได้ เช่น รูปภาพและรูปภาพผลิตภัณฑ์ซึ่งก่อนหน้านี้จะเข้าถึงไม่ได้
  • ผู้ที่ชื่นชอบงานอดิเรกในด้านต่างๆ เช่น งานไม้และการแกะสลักสามารถร่างภาพแนวคิดของตนเองได้โดยไม่ต้องลงทุนในซอฟต์แวร์ราคาแพง
  • ผู้คนและองค์กรจากกลุ่มที่ด้อยโอกาสหรือมีงานอดิเรกเฉพาะกลุ่มสามารถสร้างภาพที่ตรงกับความสนใจของพวกเขาได้

ข้อบกพร่องของ DALL-E

แม้จะมีความสามารถ แต่ DALL-E ก็มีข้อจำกัดบางประการ

ความคาดเดาไม่ได้

เนื่องจาก DALL-E สร้างภาพทุกภาพตั้งแต่เริ่มต้น จึงไม่อาจคาดเดาได้ สมมติว่าคุณมีข้อกำหนดเฉพาะสำหรับการจัดวางวัตถุหรือมาตรฐานแบรนด์ ในกรณีดังกล่าว DALL-E อาจไม่รวมมาตรฐานเหล่านั้นไว้ในผลลัพธ์เสมอไป

นอกจากนี้ การปรับข้อความแจ้งของคุณเล็กน้อยอาจส่งผลให้ผลลัพธ์แตกต่างออกไปอย่างมาก นี่เป็นเรื่องท้าทายอย่างยิ่งเมื่อเปลี่ยนภาพที่ DALL-E สร้างขึ้นแล้ว

อคติ

AI เชิงสร้างสรรค์ทั้งหมดเกี่ยวข้องกับอคติ และ DALL-E ก็ไม่ต่างกัน DALL-E อยู่ภายใต้การสร้างการตอบสนองที่สะท้อนถึงอคติเกี่ยวกับเชื้อชาติ เพศ ชนชั้น และแม้แต่บางภาษาหรือบางประเทศ DALL-E ได้รับการฝึกอบรมเกี่ยวกับข้อมูลจากสหรัฐอเมริกาเป็นหลัก ดังนั้นจึงมักจะสะท้อนถึงวัฒนธรรม ค่านิยม และอคติของชาวอเมริกัน

การใช้คำคุณศัพท์บางคำอาจนำไปสู่ผลลัพธ์ที่เหมารวม ตัวอย่างเช่น หากข้อความแจ้งมีคำ เช่น เกี่ยวกับอารมณ์หรือละเอียดอ่อนผลลัพธ์ที่ได้อาจเกี่ยวข้องกับผู้หญิง ในขณะเดียวกัน คำพูดเช่นรุนแรงหรือสติปัญญาอาจนำไปสู่ผลลัพธ์ที่มีลักษณะเป็นผู้ชาย

ค่าใช้จ่าย

DALL-E มีค่าใช้จ่าย เว้นแต่คุณจะใช้ Microsoft Image Creator ซึ่งอาจไม่สะดวก ขึ้นอยู่กับความต้องการของคุณ

หากคุณต้องการใช้ ChatGPT บนแพลตฟอร์ม AI ของ Microsoft คุณจะต้องจ่ายเงินเพื่อเข้าถึง DALL-E

อะไรต่อไปสำหรับการสร้างภาพ DALL-E และ AI

คุณสามารถใช้ DALL-E เพื่อกระตุ้นการระดมความคิดเชิงสร้างสรรค์ ปรับปรุงกระบวนการออกแบบ หรือเพียงแค่สนุกสนาน เป็นหนึ่งในแพลตฟอร์ม AI เจนเนอเรชั่นจำนวนมากที่ช่วยให้คุณสามารถสร้างในรูปแบบใหม่ๆ ได้ เนื่องจากผสานรวมกับแพลตฟอร์ม AI ที่มีอยู่ เช่น ChatGPT และ Microsoft Image Creator คุณจึงสร้างรูปภาพและสร้างข้อความได้ทั้งหมดภายในเครื่องมือเดียว

เมื่อใช้ DALL-E สิ่งสำคัญคือต้องจำไว้ว่า AI ที่สร้างสรรค์ทั้งหมดมีแนวโน้มที่จะสร้างการตอบสนองแบบเอนเอียง การรู้ข้อจำกัดของ DALL-E ช่วยให้คุณค้นหาวิธีที่ดีที่สุดในการใช้งาน และรับภาพที่คุณต้องการ

ความสามารถ คุณสมบัติ และคู่แข่งใหม่ๆ เกิดขึ้นอย่างต่อเนื่อง ใครก็ตามที่ต้องการใช้ generative AI ไม่ว่าจะเพื่อธุรกิจ ส่วนตัว หรือเพื่อการศึกษา ควรติดตามการพัฒนาล่าสุด เราจะคอยพูดถึงการเปลี่ยนแปลงที่สำคัญใน Generative AI ต่อไป ดังนั้นติดตามบล็อก Grammarly เพื่อไม่พลาดข่าวสาร