หากคุณสังเกตในช่วงไม่กี่เดือนที่ผ่านมา คุณคงเคยเห็นโพสต์บนโซเชียลมีเดีย บทความข่าว และวิดีโอเกี่ยวกับ AI และเนื้อหาที่พวกเขาสามารถสร้างได้ โดย ChatGPT ซึ่งเป็นผลิตผลของ OpenAI นั้นได้รับความนิยมมากที่สุด อินเทอร์เฟซแบบแชทช่วยให้ผู้ใช้โต้ตอบกับ AI เพื่อถามคำถาม สั่งให้ทำงาน เขียนโค้ด และแม้แต่เขียนประโยค ย่อหน้า หรือแม้แต่บทความทั้งหมด!
นอกเหนือจากโมเดลแบบข้อความ เช่น ChatGPT แล้ว ยังมี AI รูปแบบต่างๆ ให้เห็นกันมากขึ้น เช่น AI ที่สามารถสร้างรูปภาพตาม prompt ได้ (เช่น MidJourney, Stable Diffusion, DALL-E เป็นต้น) คุณสามารถขอให้ AI เหล่านี้สร้างงานศิลปะดิจิทัลตามคำแนะนำดังนี้:
Prompt:
Space battleship, causing objects to disintegrate into atomic particles. cinematic shot + dynamic composition, incredibly detailed, sharpen, details + intricate detail + professional lighting, film lighting + 35mm + anamorphic + lightroom + cinematography + bokeh + lens flare + film grain + HDR10 + 8K + Roger Deakins, ((cinematic)), perfect composition, hyperrealistic, super detailed, 8k, high quality, trending art, trending on artstation, sharp focus, studio photo, intricate details, highly detailed
Negative Prompt:
(3d, cartoon, anime, sketches), (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), bad anatomy, out of view, cut off, ugly, deformed, mutated, ((young)), EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers, (ugly eyes, deformed iris, deformed pupils, fused lips and teeth:1.2), (un-detailed skin, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.2), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions
Steps:
30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 189104945, Size: 1024x1024, Model hash: 31e35c80fc, Model: sd_xl_base_1.0, Clip skip: 2, Version: v1.5.1
ด้วยวิธีการเหล่านี้ นี่คือผลลัพธ์ที่เราได้รับจาก prompt:
เป็นที่เข้าใจได้ว่าการเข้าถึงเครื่องมืออันทรงพลังดังกล่าวทำให้ทั้งอุตสาหกรรมต่างตกตะลึง แม้ว่าจะไม่มี AI ใด ที่สามารถจำลองความสามารถของมนุษย์ได้อย่างแท้จริง แต่งานศิลปะ กราฟิก การเขียน และความคิดสร้างสรรค์โดยทั่วไป หลายอาชีพก็เริ่มได้รับผลกระทบ
อย่างไรก็ตาม เนื้อหาที่สร้างโดย AI ยังคงถูกใช้เป็นช่องทางในการสร้างเนื้อหาทั่วไปเท่านั้น (ข้อความ ตัวอย่างโค้ด รูปภาพ หรือกราฟิก) เนื่องจากผลงานที่ได้มักจะไม่ถูกต้องทั้งหมดเกี่ยวกับหัวข้อต่างๆ อันที่จริง
Google’s Bard AI chatbot ได้มีข้อผิดพลาดในการสาธิตครั้งแรก! !
กล่าวได้ว่าประโยชน์ของ AI จะพัฒนาขึ้นอีกแน่นอนในอนาคต เราน่าจะได้เห็นการมาถึงของ AI รุ่นใหม่ที่ปรับปรุงจากเวอร์ชันก่อนหน้าแล้ว
VRAM และ AI: ต้องใช้เยอะแค่ไหน?
AI ที่มีในปัจจุบันมีความโดดเด่นเนื่องจากมีลักษณะเป็น open-source ทำให้ผู้ใช้ ธุรกิจ และองค์กรต่างๆ สามารถใช้ AI เหล่านี้บนฮาร์ดแวร์ของตนภายในเครื่องได้โดยไม่ต้องกังวลเรื่องความเป็นส่วนตัวหรือความปลอดภัย
แม้ว่าธุรกิจขนาดใหญ่จะไม่ขาดโครงสร้างพื้นฐานหรือเงินทุนในการใช้ AI เหล่านี้ แต่บุคคลและผู้เชี่ยวชาญที่ต้องการใช้ประโยชน์จาก AI ก็สามารถเผชิญกับความท้าทายได้ สาเหตุหนึ่งที่ทำให้ AI ทำงานช้ามากหรือถึงขั้นไม่รองรับฮาร์ดแวร์สมัยใหม่เลยก็คือข้อกำหนดของ VRAM สำหรับ AI เหล่านั้น
ข้อกำหนดขั้นต่ำของ Stable Diffusion XL
ตัวอย่างหนึ่งคือ Stable Diffusion XL (SDXL) ที่เพิ่งเปิดตัวจาก Stability AI บริษัทอธิบายว่าเป็นรุ่นที่ “ล้ำหน้าที่สุด” ในปัจจุบัน
โดยตอนนี้สามารถสร้างใบหน้าที่สมจริง ข้อความที่อ่านง่าย และงานศิลปะที่สวยงามน่าพึงพอใจยิ่งขึ้นโดยใช้ prompt ที่สั้นลง อย่างไรก็ตาม ความสามารถที่ได้รับการปรับปรุงเหล่านี้ต้องแลกมาด้วยต้นทุนด้านฮาร์ดแวร์ โดยเฉพาะข้อกำหนด VRAM และประสิทธิภาพของ GPU
แล้วคุณต้องการฮาร์ดแวร์อะไรกันแน่เพื่อที่จะเพลิดเพลินกับ SDXL บนเครื่องของคุณที่บ้าน?
อันดับแรกแนะนำให้ใช้กราฟิกการ์ด ดังนั้นเราจะใช้ผลิตภัณฑ์รุ่นปัจจุบันและรุ่นก่อนหน้าเพื่อทำความเข้าใจประสิทธิภาพที่คุณสามารถคาดหวังจากผลิตภัณฑ์เหล่านั้นได้ดียิ่งขึ้น แม้ว่า Stability AI จะขอ VRAM ขั้นต่ำ 8 GB ใน
ข่าวประชาสัมพันธ์ที่เผยแพร่ แต่เราต้องการกำหนดขอบเขตผลกระทบของความจุ VRAM ที่สูงขึ้น
การเพิ่มต้องการขั้นต่ำ (หรือเกินค่านั้นเล็กน้อย) ส่งผลกระทบอย่างมากต่อประสิทธิภาพหรือไม่ หรือ GPU ที่ทรงพลังกว่าสามารถชดเชยการขาด VRAM ได้หรือไม่
เพื่อตอบคำถามนั้น เราให้ห้องปฏิบัติการของเราลองดูว่ามันทำงานอย่างไรบนฮาร์ดแวร์รุ่นปัจจุบันและรุ่นก่อนหน้า ข้อมูลนี้จะช่วยให้คุณตัดสินใจซื้อได้อย่างมีข้อมูลมากขึ้นเมื่อเลือกซื้อกราฟิกการ์ดตัวถัดไป
SDXL GPU Benchmarks สำหรับการ์ดกราฟิกการ์ด GeForce
สำหรับการทดสอบ เราจะใช้การ์ดกราฟิก RTX 4060 Ti 16 GB, RTX 3080 10 GB และ RTX 3060 12 GB
ขั้นแรก เรามาเริ่มด้วยการจัดองค์ประกอบทางศิลปะแบบง่ายๆ โดยใช้พารามิเตอร์เริ่มต้นเพื่อให้ GPU ของเราทำงานได้ดี
1024 x 1024
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
11.4 GB
16.0 s
RTX 3080 10G
9.7 GB
65.1 s
RTX 3060 12G
11.7 GB
27.2 s
ผลลัพธ์ที่ได้อาจเป็นเรื่องที่น่าแปลกใจสำหรับผู้ที่มักจะเน้นไปที่การวัดประสิทธิภาพการเล่นเกมเท่านั้น
RTX 4060 Ti 16GB พร้อมด้วยบัฟเฟอร์ VRAM ขนาด 16GB แซงหน้าเป็นผู้นำกลุ่มได้อย่างง่ายดายด้วยการรันอย่างรวดเร็วเพียง 16 วินาที เพื่อทำงานให้เสร็จสิ้น รองลงมารองลงมาด้วย VRAM ขนาด 12GB คือ RTX 3060 12GB ที่มีเวลา 27.2 วินาที มันไม่เยี่ยมยอดแต่ก็ยังค่อนข้างดี
น่าเสียดายที่การไม่มี VRAM บน RTX 3080 หมายความว่าพลังดิบไร้ประโยชน์ ด้วยเวลาที่ช้ามากถึง 65.1 วินาที! ดังนั้น RTX 4060 Ti 16GB จะนำหน้า RTX 3080 รุ่นก่อนหน้าระดับไฮเอนด์ด้วยเวลาการสร้างภาพที่เร็วขึ้น 4 เท่า
SDXL Benchmark: 1024x1024 + LoRA
เรามาเพิ่มเดิมพันกันหน่อย สำหรับการทดสอบครั้งต่อไป เราจะลองใช้ LoRA
LoRA หรือ Low-Rank Adaptation เทคนิคการปรับตัวระดับต่ำช่วยให้คุณสามารถปรับแต่ง Stable Diffusion ตามสไตล์ศิลปะหรือตัวละครเฉพาะได้ อย่างไรก็ตาม สิ่งนี้จะทำให้คุณต้องใช้ VRAM มากขึ้น ดังนั้นเรามาดูกันว่าคู่แข่งของเรามีประสิทธิภาพอย่างไร
ลองใช้ LoRA เพื่อสร้างงานศิลปะ 'Cybergirl' เพื่อค้นหาว่ากราฟิกการ์ดที่มี VRAM เพียงพอและเหลือเฟือมีความแตกต่างกันมากเพียงใด
1024 x 1024 + LoRA
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
15.5 GB
17.0 s
RTX 3080 10G
9.6 GB
98.8 s
RTX 3060 12G
11.5 GB
26.8 s
RTX 4060 Ti 16GB เป็นผู้นำอีกครั้งโดยใช้เวลาเพียง 17 วินาทีในการสร้างภาพ ในขณะที่ RTX 3080 ใช้เวลาถึง 98.8 วินาที
SDXL Benchmarks: 1024x1024 + LoRA + ControlNet
มาทำให้ยากขึ้นอีกหน่อยด้วยเงื่อนไขเพิ่มเติมบางอย่างโดยใช้ ControlNet
ก่อนอื่น ControlNet คืออะไรกันแน่? พูดง่ายๆ ก็คือโมเดลโครงข่ายประสาทเทียมที่คุณสามารถใช้เพื่อควบคุมและปรับแต่งองค์ประกอบ (เอาต์พุต) ที่เสถียรเพิ่มเติมได้ ช่วยให้คุณบอก Stable Diffusion ว่าคุณกำลังให้ข้อมูลอ้างอิงที่ชัดเจนกับการออกแบบที่คุณต้องการโดยการเพิ่มเงื่อนไขเพิ่มเติมให้กับเอาต์พุต ปรับแต่งผลลัพธ์เพิ่มเติมให้ตรงกับสิ่งที่คุณต้องการมากขึ้น
ไปที่ ControlNet GitHub page เพื่อดูรายละเอียดและเอกสารเพิ่มเติมเกี่ยวกับวิธีการตั้งค่า!
1024 x 1024 + LoRA + controlnet
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
15.2 GB
48.7 s
RTX 3060 12G
11.5 GB
89.2 s
เป็นการแข่งขันที่สูสี โดย RTX 3080 เกือบจะปิดช่องว่างได้ แต่ RTX 4060 TI 16 GB ก็เอาชนะในที่สุด และชนะ RTX 3060 12 GB อย่างสิ้นเชิง อย่างไรก็ตาม แม้ในสถานการณ์ที่ต้องใช้การประมวลผลอย่างหนัก RTX 4060 Ti 16GB ก็ยังอยู่เหนือกว่า
SDXL Benchmark: 1024x1024 + Upscaling
เรามาลองเพิ่มขนาดดูบ้าง มาดูกันว่าพลังดิบของ RTX 3080 จะเอาชนะได้ไหมกับการทดสอบนี้? เราจะใช้ Real Enhanced Super-Resolution Generative Adversarial Networks หรือที่รู้จักกันในชื่อย่อที่เข้าใจง่ายกว่าคือ R-ESRGAN 4x+.
1024 x 1024 upscale x2
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
10.8 GB
5.5 s
RTX 3060 12G
10.4 GB
7.8 s
สำหรับรูปภาพขนาด 1024x1024 ที่อัปเกรดเป็น 2x นั้น RTX 4060 Ti 16 GB เหนือกว่าทั้ง RTX 3080 และ RTX 3060 12 GB โดยใช้เวลาเพียง 5.5 วินาที ซึ่งเร็วกว่า RTX 3080 10 GB ถึง 36%
1024 x 1024 upscale x4
VRAM Size(GB)
Speed(sec.)
RTX 4060 Ti 16G
10.5 GB
10 s
RTX 3060 12G
10.4 GB
12.3 s
ช่องว่างระหว่าง RTX 4060 Ti 16 GB ในการแข่งขันลดน้อยลงไปอีกด้วยงานอัปสเกล 4x โดยใช้ตัวอัปสเกล R-ESRGAN 4x+ ซึ่งตอนนี้ RTX 4060 Ti 16 GB ทำงานได้เร็วกว่า RTX 3080 10 GB ถึง 23% อย่างไรก็ตาม RTX 4060 Ti 16GB ยังคงเป็นผู้นำ
ดังที่คุณเห็นจากผลลัพธ์ ยิ่งภาระงานในการเพิ่มสเกลมีความเข้มข้นมากขึ้น RTX 3080 ก็จะยิ่งเข้าใกล้มากขึ้นเท่านั้น
กราฟิกการ์ดที่คุ้มค่าที่สุดสำหรับ Stable Diffusion XL
เมื่อพูดถึง AI เช่น Stable Diffusion XL การมี VRAM ที่เพียงพอเป็นสิ่งสำคัญ จากการทดสอบข้างต้น จะเห็นได้ว่า RTX 4060 Ti 16GB เป็นกราฟิกการ์ดที่คุ้มค่าที่สุดสำหรับการสร้างภาพ AI ที่คุณสามารถซื้อได้ตอนนี้
คุณสามารถไปที่
Stability AI’s GitHub page เพื่อค้นหาข้อมูลเพิ่มเติมเกี่ยวกับ SDXL และข้อมูลอื่นๆ โดย Stability AI.
VIDEO