- มุมมองแบบไดนามิกของ เมถุน แปลงคำตอบให้เป็นประสบการณ์ทางภาพและการโต้ตอบเพื่อให้เข้าใจแนวคิดที่ซับซ้อนได้ดีขึ้น
- Dynamic View และการออกแบบภาพกำลังได้รับการเผยแพร่อย่างต่อเนื่องและยังไม่พร้อมใช้งานในแอปมือถือ Gemini
- คำตอบจะถูกจัดระเบียบเป็นแท็บ บัตร และรูปภาพซึ่งสามารถเข้าถึงแหล่งภาพต้นฉบับได้ง่าย
- คลื่นลูกใหม่ของ IA ผสมผสานมุมมองแบบไดนามิกและบทสนทนาแนะนำเพื่อมอบผลลัพธ์ที่มีประโยชน์และเป็นส่วนตัวมากขึ้น

มุมมองไดนามิกของ Gemini กำลังเป็นจุดเปลี่ยน ในลักษณะที่ เราโต้ตอบกับแชทบอทปัญญาประดิษฐ์ไม่ใช่แค่การอ่านข้อความตอบกลับอีกต่อไป: ตอนนี้คุณสามารถเห็นการจำลอง การเปรียบเทียบภาพ รูปภาพ และองค์ประกอบแบบอินเทอร์แอคทีฟ ที่ทำให้แนวคิดที่ซับซ้อนเข้าใจง่ายขึ้นมาก ในแง่หนึ่ง มันคือการนำบทสนทนาทั่วไปกับ AI เข้าสู่โลกแห่งภาพและแทบจะ "เล่นได้" เลย
วิธีการตอบสนองแบบใหม่นี้ไม่สามารถเข้าถึงทุกคนได้ในคราวเดียว และไม่ได้ทำงานเหมือนกันในทุกอุปกรณ์ แต่ เมื่อเปิดใช้งานมุมมองแบบไดนามิกบนบัญชีของคุณ คุณจะสังเกตเห็นการเปลี่ยนแปลงของประสบการณ์ทันทีแทนที่จะจำกัดอยู่เพียงย่อหน้าและสมการ Gemini สามารถสร้างแอปพลิเคชันแบบโต้ตอบขนาดเล็กให้คุณได้แบบเรียลไทม์ โดยคุณเลือกตัวเลือก เปลี่ยนพารามิเตอร์ และดูว่าจะเกิดอะไรขึ้นในทันที เหมือนกับว่ามันเป็นเครื่องมือขนาดเล็กที่ออกแบบมาเฉพาะตามคำถามของคุณ
Dynamic View ของ Gemini คืออะไร และแตกต่างจากโหมดข้อความอย่างไร
เมื่อเราพูดถึงมุมมองแบบไดนามิก เรากำลังหมายถึง โหมดตอบสนอง Gemini ซึ่งเนื้อหาจะถูกนำเสนอในรูปแบบภาพ แบบโต้ตอบ และมัลติมีเดียแทนที่จะคงอยู่ในรูปแบบข้อความธรรมดา Google ได้รับการออกแบบเพื่อให้สามารถสร้างแบบจำลองได้จากพรอมต์ใดๆ ก็ได้:
- การจำลองและเครื่องมือแบบโต้ตอบ (เช่น โมเดลที่สามารถปรับเปลี่ยนหรือควบคุมแอนิเมชั่นได้)
- การสรุปภาพ พร้อมบล็อก, การ์ด, แผง และคำอธิบายทีละขั้นตอน
- เนื้อหามัลติมีเดียแบบบูรณาการในขณะที่ ภาพสนับสนุน หรือการเปรียบเทียบแบบขนาน
ตามที่ Google ได้อธิบายไว้ ตัวเลือกนี้ ช่วยให้โมเดล AI สร้างประสบการณ์ที่สมจริงแบบเรียลไทม์จากคำขอใดๆ ก็ได้ซึ่งหมายความว่า หากคุณถามเกี่ยวกับหัวข้อที่ซับซ้อน แทนที่จะแค่ถามสูตรต่างๆ ออกมาเป็นชุดๆ คุณสามารถสร้าง "ฉาก" แบบโต้ตอบได้ เช่น แถบเลื่อนสำหรับเปลี่ยนค่า ปุ่มสำหรับสลับมุมมอง ขั้นตอนที่ดำเนินไป ฯลฯ
ความแตกต่างกับราศีเมถุนแบบคลาสสิกนั้นชัดเจน: ในโหมดปกติ คุณจะได้รับข้อความที่มีโครงสร้าง บางทีอาจมีกล่องหรือตารางด้วยด้วย Dynamic View คุณจะเข้าสู่รูปแบบภาพที่ชัดเจนยิ่งขึ้น คล้ายกับการอ่านบทความยาวๆ ไปจนถึงการดูคำอธิบายพร้อมกราฟิกและตัวควบคุมแบบเคลื่อนไหว เพื่อให้คุณได้ทดลองทำด้วยตนเอง
แนวทางนี้ทำให้ AI เข้าถึงได้ง่ายขึ้นสำหรับผู้ที่สับสนกับสูตรหรือข้อความหนาแน่นแทนที่จะบังคับให้คุณจินตนาการว่าเกิดอะไรขึ้น ระบบจะแสดงสิ่งนั้นให้คุณเห็นบนหน้าจอ พร้อมด้วยองค์ประกอบต่างๆ ที่คุณสามารถเคลื่อนย้ายหรือเปลี่ยนแปลงเพื่อให้เข้าใจแนวคิดได้ดีขึ้น
การทำงานของ Dynamic View ในทางปฏิบัติ: ตัวอย่างปัญหาสามส่วน

ตัวอย่างที่ดีที่สุดอย่างหนึ่งในการทำความเข้าใจว่า Dynamic View นำเสนออะไรบ้างนั้นสามารถพบได้ใน ถามราศีเมถุนเกี่ยวกับปัญหาสามวัตถุอันโด่งดังทฤษฎีบท ซึ่งเป็นทฤษฎีคลาสสิกทางฟิสิกส์และกลศาสตร์ท้องฟ้า เกี่ยวข้องกับการคำนวณการเคลื่อนที่ของวัตถุสามชิ้นที่ดึงดูดกันด้วยแรงโน้มถ่วง (เช่น ดวงดาวหรือดาวเคราะห์) เป็นระบบที่ซับซ้อนและสับสนอย่างเหลือเชื่อ
หากคุณถามคำถามนั้นกับ Gemini เวอร์ชันที่ตอบกลับเป็นข้อความเท่านั้น คำตอบปกติก็คือ มันให้คำอธิบายที่จัดระบบอย่างดี แต่เต็มไปด้วยสูตรและคำศัพท์ทางเทคนิคสำหรับคนที่ไม่มีพื้นฐานฟิสิกส์มาก่อน นั่นอาจเป็นเรื่องที่น่าประทับใจ... และน่าหนักใจมาก คุณจะเห็นสมการเชิงอนุพันธ์ นิพจน์ทางคณิตศาสตร์ และนิยามของความโกลาหลแบบไดนามิกที่ไม่ค่อยสมเหตุสมผลนัก
อย่างไรก็ตาม เมื่อถามคำถามเดียวกัน แต่เปิดใช้งานมุมมองแบบไดนามิก AI สร้างการจำลองภาพแบบโต้ตอบที่คุณสามารถปรับแต่งได้ในประสบการณ์นั้น คุณสามารถ:
- สลับระหว่างโหมดจำลองที่แตกต่างกัน (เช่น ดูระบบที่มีสองวัตถุและมีสามวัตถุ)
- ปรับความเร็ว เพื่อสังเกตว่าวงโคจรมีวิวัฒนาการช้าลงหรือเร็วขึ้นอย่างไร
- ดูคำอธิบายสั้นๆ ควบคู่ไปกับแอนิเมชั่นซึ่งจะชี้แจงให้ทราบถึงเหตุการณ์ที่เกิดขึ้นในแต่ละกรณี
ก่อนอื่น ราศีเมถุนจะสอนคุณเกี่ยวกับสถานการณ์ง่ายๆ ที่มีวัตถุสองดวง เช่น โลกและดวงจันทร์ แสดงวงโคจรที่เสถียรและคาดเดาได้ค่อนข้างง่ายจากนั้น เมื่อคุณเพิ่มวัตถุที่สาม ความโกลาหลก็เกิดขึ้น: วิถีการเคลื่อนที่จะเปลี่ยนแปลงอย่างมากเพื่อตอบสนองต่อการเปลี่ยนแปลงเล็กๆ น้อยๆ ในเงื่อนไขเริ่มต้น ซึ่งมักเรียกกันว่าปรากฏการณ์ผีเสื้อ
ต้องขอบคุณการสาธิตนี้ นี่อธิบายได้ว่าทำไมระบบดาวสามดวงจึงมีแนวโน้มที่จะไม่เสถียร และมันยากที่จะคาดเดา ในขณะที่สูตรต่างๆ ให้ความรู้สึกเหมือนอยู่ห่างไกลและลึกลับ แต่การจำลองกลับทำให้แนวคิดนั้น "คลิก" ในใจผู้ใช้ ความแตกต่างระหว่างการอ่านกับการมองเห็นนั้นมหาศาล
ประสบการณ์ดังกล่าวทำให้เห็นชัดเจนว่าโลกของแชทบอทกำลังมุ่งหน้าไปทางไหน: การสนทนาจะมีรูปแบบเป็นภาพ มีการโต้ตอบกัน และสนุกสนานมากขึ้นคุณเปลี่ยนพารามิเตอร์ ดูว่าการจำลองเปลี่ยนแปลงไปอย่างไร และในกระบวนการนี้ แนวคิดจะฝังแน่นอยู่ในความทรงจำของคุณได้ดีขึ้นมาก นี่เป็นวิธีการเรียนรู้ที่น่าสนใจ เพราะคุณจะรู้สึกเหมือนกำลัง "เล่น" กับแนวคิดนั้น แทนที่จะท่องจำทฤษฎีเพียงอย่างเดียว
การใช้การออกแบบภาพและมุมมองแบบไดนามิกใน Gemini: สิ่งที่คุณต้องการ
เพื่อที่จะสามารถเพลิดเพลินไปกับสิ่งเหล่านี้ได้ สิ่งสำคัญคือต้องเข้าใจว่า การออกแบบภาพและมุมมองไดนามิกกำลังได้รับการเผยแพร่อย่างค่อยเป็นค่อยไปผู้ใช้แต่ละคนไม่มีตัวเลือกเหมือนกันในเวลาเดียวกัน และ Google กำลังใช้ขั้นตอนนี้เป็นพื้นที่ทดสอบเพื่อปรับปรุงประสบการณ์
ในทางปฏิบัติหมายความว่า คุณอาจเห็นเพียงการออกแบบภาพ มุมมองแบบไดนามิก หรือรูปแบบต่างๆ ในบัญชีของคุณ มันมาจากแนวคิดเดียวกัน Google อธิบายไว้อย่างชัดเจนว่าฟีเจอร์เหล่านี้กำลังทยอยเปิดตัว และในส่วนหนึ่งของการทดลองนี้ คุณอาจเข้าถึงเวอร์ชันใดเวอร์ชันหนึ่งได้ แต่ไม่จำเป็นต้องเข้าถึงทั้งหมด
นอกจากนี้ ยังมีข้อจำกัดสำคัญอยู่ประการหนึ่ง: Dynamic View ยังไม่พร้อมใช้งานในแอปมือถือ Geminiกล่าวอีกนัยหนึ่ง หากคุณเปิด Gemini จากอุปกรณ์มือถือของคุณ คุณอาจจะใช้ได้เพียงโหมดข้อความ (หรือการออกแบบพื้นฐานกว่า) เท่านั้น และประสบการณ์แบบไดนามิกจะถูกจำกัดให้อยู่ในเวอร์ชันเว็บหรือการใช้งานเบราว์เซอร์บางอย่างเท่านั้นในตอนนี้
ดังนั้นเพื่อใช้ประโยชน์สูงสุดจากโหมดภาพและมุมมองไดนามิก ขอแนะนำให้ใช้ Gemini บนอุปกรณ์เดสก์ท็อปหรือแล็ปท็อปที่มีเบราว์เซอร์อัปเดต และโปรดอดทนรอในขณะที่ Google ดำเนินการเปิดตัวให้เสร็จสมบูรณ์ ฟีเจอร์นี้มักจะปรากฏและหายไปภายในเวลาหลายสัปดาห์ ขึ้นอยู่กับการทดลองที่กำลังดำเนินอยู่
การจัดระเบียบข้อมูล: แท็บ การ์ด และรูปภาพ
จุดเด่นอย่างหนึ่งของ การออกแบบภาพแบบเจมินี่ นั่นคือ จัดระเบียบข้อมูลลงในบล็อคและแท็บแทนที่จะนำเสนอเป็นข้อความเชิงเส้นเพียงข้อความเดียว วิธีนี้ทำให้ค้นหาคำตอบได้ง่ายขึ้น: คุณเลือกส่วนที่คุณต้องการดูในเวลาใดก็ได้ และคุณจะไม่ต้องเผชิญกับ "กำแพง" ของเนื้อหา
เมื่อราศีเมถุนตัดสินใจใช้รูปแบบนี้ มันสามารถแสดงให้คุณเห็น หลายแท็บที่ด้านบนของคำตอบแต่ละส่วนจะมุ่งเน้นไปที่หัวข้อที่แตกต่างกัน เช่น คำจำกัดความ ตัวอย่าง บริบททางประวัติศาสตร์ ขั้นตอน ฯลฯ คุณเพียงแค่คลิกที่ส่วนต่างๆ เพื่อเข้าถึงส่วนที่คุณสนใจโดยไม่สับสน
โครงสร้างประเภทนี้มีประโยชน์อย่างยิ่งเมื่อเนื้อหามีความหนาแน่นมาก เนื่องจาก มันช่วยให้คุณได้สิ่งที่คุณต้องการอย่างรวดเร็วและไม่เครียดหากคุณสนใจเฉพาะเนื้อหาสรุป ให้ไปที่แท็บแรก หากต้องการเจาะลึกยิ่งขึ้น ให้ไปที่แท็บอื่นๆ คำตอบนี้มีลักษณะเป็นโมดูลมากกว่า
นอกจากระบบแท็บนี้แล้ว การออกแบบภาพยังรวมเอา บัตร รายการที่หลากหลาย และบล็อกข้อมูลขนาดเล็กที่มีการเน้นภาพด้วยวิธีนี้ ข้อมูลที่สำคัญที่สุดจะถูกเน้นและไม่สูญหายไปท่ามกลางย่อหน้าอันยาวเหยียด
ในส่วนของภาพนั้น Gemini สามารถแสดงแหล่งข้อมูลภาพสนับสนุนที่มีแหล่งที่มา เมื่อพร้อมใช้งานจะมีการระบุไว้ที่มุมขวาบนของรูปภาพในหลายกรณี คุณจะเห็นลิงก์หรือไอคอนที่ให้คุณเปิดแหล่งที่มาต้นฉบับได้
หากคุณต้องการตรวจสอบหน้าแหล่งที่มาของรูปภาพ คุณสามารถคลิกตัวเลือก "ขยาย" เพื่อเปิดในแท็บเบราว์เซอร์ใหม่จากนั้นคุณจะสามารถเข้าถึงบริบททั้งหมดได้ เช่น บทความ เว็บไซต์ ผู้เขียน ฯลฯ ถือเป็นวิธีที่สะดวกในการตรวจสอบแหล่งที่มาของเนื้อหาภาพและเจาะลึกยิ่งขึ้นหากมีสิ่งใดที่ดึงดูดใจคุณ
การประยุกต์ใช้งานจริงของ Dynamic View: จากความน่าจะเป็นสู่แฟชั่น
ความเป็นไปได้ของ Dynamic View ไม่ได้จำกัดอยู่เพียงตัวอย่างทางฟิสิกส์เท่านั้น Google ชี้แจงชัดเจนว่าแนวทางนี้สามารถใช้งานได้อย่างแทบไม่จำกัดเนื่องจากคำกระตุ้นใดๆ ก็สามารถแปลงเป็นประสบการณ์ทางภาพและการโต้ตอบได้ หากโมเดลเห็นว่าเหมาะสม
เช่น เมื่อศึกษาเรื่องทฤษฎีความน่าจะเป็น Gemini สามารถแสดงการจำลองการทอยลูกเต๋า รูเล็ต หรือกระบวนการสุ่มได้ ซึ่งปรากฏซ้ำหลายครั้งบนหน้าจอ วิธีนี้ช่วยให้คุณเห็นได้อย่างชัดเจนว่าความถี่สัมพัทธ์บรรจบกันเป็นค่าเชิงทฤษฎีเมื่อจำนวนการทดสอบเพิ่มขึ้น
ในด้านต่างๆ ในชีวิตประจำวัน เช่น แฟชั่น Dynamic View สามารถจัดระเบียบคำแนะนำด้านเสื้อผ้าในรูปแบบของการผสมผสาน แผงเปรียบเทียบ หรือข้อเสนอแนะด้านสไตล์แทนที่จะให้รายการเสื้อผ้าแบบแห้งๆ แก่คุณ มันจะแสดงรายการ "รูปลักษณ์" ที่เป็นไปได้ ความแตกต่างของสี และคำแนะนำที่เหมาะกับโอกาสต่างๆ
นอกจากนี้ยังสามารถใช้เพื่อจดจำรายละเอียดจากซีรีย์ทีวีหรือภาพยนตร์ได้อีกด้วย: ถ้าถามถึงตอนจบของซีรีส์อย่าง How I Met Your MotherGemini สามารถให้ภาพรวมโดยแสดงไทม์ไลน์แบบเรียบง่าย ตัวละครหลัก และจุดพลิกผันของเนื้อเรื่องหลักโดยที่คุณไม่ต้องอ่านเนื้อเรื่องย่อที่ยาวเหยียด
เพื่อก้าวไปอีกขั้น บางคนถึงกับขอให้เขาอธิบายภาพยนตร์ที่ซับซ้อนเป็นพิเศษ เช่นเรื่อง "Tenet" Gemini ได้ก้าวไปไกลถึงขั้นสร้างรูปแบบภาพที่มีรายละเอียด เพื่อพยายามวิเคราะห์โครงสร้างเวลาของภาพยนตร์ จึงใช้กราฟิกที่เชื่อมโยงตัวละคร เส้นเวลา และเหตุการณ์ต่างๆ เข้าด้วยกัน แม้ว่าจะไม่ใช่ทุกคนที่จะเข้าใจอย่างถ่องแท้ แต่เครื่องมือนี้แสดงให้เห็นว่าสามารถปรับให้เข้ากับเนื้อหาที่ซับซ้อนได้ดีเพียงใด
อย่างไรก็ตามการตอบสนองประเภทนี้ จะใช้เวลานานกว่าการสร้างแบบข้อความล้วนๆ เพียงไม่กี่วินาทีมันไม่เหมาะสำหรับคนใจร้อน แต่เมื่อประสบการณ์การโหลดเสร็จสิ้น การรอคอยก็มักจะคุ้มค่า: การผสมผสานระหว่างการโต้ตอบและเนื้อหาภาพทำให้ข้อมูลน่าสนใจและจดจำได้ง่ายขึ้นมาก
บทบาทของพรอมต์ในยุคของมุมมองแบบไดนามิก
มีการกล่าวซ้ำมานานแล้วว่า คุณภาพที่รวดเร็วคือทุกสิ่งหากคุณไม่เรียบเรียงคำถามให้ดี คุณก็จะไม่ได้คำตอบที่ดี ด้วยมุมมองแบบไดนามิกและอินเทอร์เฟซแบบสนทนาที่มากขึ้น แรงกดดันที่ผู้ใช้ได้รับจึงลดลงอย่างมาก
ในสถานการณ์เช่นโหมดมุมมองแบบไดนามิกหรือการค้นหาการซื้อ คำเตือนเบื้องต้นเป็นเพียงจุดเริ่มต้นหากคำขอของคุณคลุมเครือหรือไม่ชัดเจน ระบบจะถามคำถาม ชี้แจงข้อสงสัย และกรอกข้อมูลที่ขาดหายไป การสนทนาจะกลายเป็นกระบวนการที่เป็นธรรมชาติและทำซ้ำได้มากขึ้น
ซึ่งทำให้โมเดล AI เข้าถึงได้ง่ายขึ้นสำหรับผู้ที่ไม่ต้องการหรือไม่รู้วิธีเขียนคำแนะนำที่ซับซ้อนมากนักแม้ว่าคำแนะนำเบื้องต้นของคุณจะค่อนข้างทั่วไป แต่ผู้ช่วยสามารถแนะนำคุณด้วยคำถามง่ายๆ จนกระทั่งสร้างภาพที่ชัดเจนว่าคุณกำลังมองหาอะไรจริงๆ
นอกจากนี้ ด้วยการรวมองค์ประกอบภาพ การอธิบายสามารถทำได้ไม่เพียงแต่ด้วยคำพูดเท่านั้น แต่ยังรวมถึงตัวอย่างกราฟิกด้วยแทนที่จะถามคุณว่า "คุณชอบสไตล์นี้หรือสไตล์นั้น" ในรูปแบบข้อความ ระบบสามารถแสดงตัวเลือกภาพสองชุดให้คุณเลือกได้ ทำให้ทุกอย่างใช้งานง่ายขึ้นมาก
ทั้งหมดนี้ชี้ให้เห็นถึงจุดเริ่มต้นของยุคใหม่ของ AI chatbots: โมเดลที่อยากรู้อยากเห็นและใคร่รู้มากขึ้น มุ่งเน้นในการสร้างคำตอบที่มีประโยชน์ ภาพ การโต้ตอบ และความบันเทิงมากขึ้นพวกเขาไม่เพียงแค่ตอบคำถามของคุณอีกต่อไป แต่พวกเขาพยายามที่จะเข้าใจคุณให้ดีขึ้นเพื่อมอบสิ่งที่ตรงกับความคิดของคุณอย่างแท้จริง
จากภายนอก วิวัฒนาการนี้อาจดูเหมือนเป็นเพียงการปรับปรุงด้านสุนทรียศาสตร์ แต่ในความเป็นจริงแล้ว มันเกี่ยวข้องกับ การเปลี่ยนแปลงอย่างลึกซึ้งในวิธีที่เราเกี่ยวข้องกับเทคโนโลยีAI ไม่ใช่แค่ "เครื่องมือเขียนข้อความ" อีกต่อไป แต่เป็นเครื่องสร้างประสบการณ์ที่สมบูรณ์แบบ โดยที่การเห็น การสัมผัส (แบบดิจิทัล) และการรับประสบการณ์กลายมาเป็นสิ่งสำคัญพอๆ กับการอ่าน
ด้วยคุณสมบัติต่างๆ เช่น มุมมองไดนามิกของ Gemini การออกแบบภาพแบบแท็บ การจำลองแบบเรียลไทม์ และโหมดโต้ตอบจากผู้ช่วยอื่นๆ เรากำลังเข้าสู่ยุคที่การเรียนรู้ การค้นคว้า หรือการซื้อด้วยความช่วยเหลือของ AI กลายเป็นเรื่องชัดเจน น่าดึงดูดใจมากขึ้น และน่าสนุกมากขึ้นด้วย มากกว่าการแค่นั่งอยู่หน้าบล็อกข้อความคงที่ธรรมดาๆ
นักเขียนผู้หลงใหลเกี่ยวกับโลกแห่งไบต์และเทคโนโลยีโดยทั่วไป ฉันชอบแบ่งปันความรู้ผ่านการเขียน และนั่นคือสิ่งที่ฉันจะทำในบล็อกนี้ เพื่อแสดงให้คุณเห็นสิ่งที่น่าสนใจที่สุดเกี่ยวกับอุปกรณ์ ซอฟต์แวร์ ฮาร์ดแวร์ แนวโน้มทางเทคโนโลยี และอื่นๆ เป้าหมายของฉันคือการช่วยคุณนำทางโลกดิจิทัลด้วยวิธีที่เรียบง่ายและสนุกสนาน
