- Chế độ xem động của Gemini Nó chuyển đổi câu trả lời thành trải nghiệm trực quan và tương tác để hiểu rõ hơn các khái niệm phức tạp.
- Chế độ xem động và thiết kế trực quan đang được triển khai dần dần và hiện chưa có trên ứng dụng di động Gemini.
- Các câu trả lời được sắp xếp thành các tab, thẻ và hình ảnh để dễ dàng truy cập vào các nguồn hình ảnh gốc.
- Làn sóng mới của IA Nó kết hợp chế độ xem động và hộp thoại hướng dẫn để mang lại kết quả hữu ích và cá nhân hóa hơn.
Góc nhìn năng động của Song Tử đang đánh dấu một bước ngoặt theo cách mà Chúng tôi tương tác với chatbot trí tuệ nhân tạoKhông còn chỉ là đọc phản hồi văn bản nữa: giờ đây bạn có thể xem các mô phỏng, so sánh trực quan, hình ảnh và các yếu tố tương tác giúp các khái niệm phức tạp dễ hiểu hơn nhiều. Theo một cách nào đó, nó đang đưa cuộc trò chuyện thông thường với AI vào thế giới trực quan và gần như "có thể chơi được".
Cách phản hồi mới này chưa đến được với tất cả mọi người cùng một lúc, cũng không hoạt động giống nhau trên tất cả các thiết bị, nhưng Khi chế độ Dynamic View được kích hoạt trên tài khoản của bạn, bạn sẽ ngay lập tức nhận thấy sự thay đổi trong trải nghiệm.Thay vì bị giới hạn ở các đoạn văn và phương trình, Gemini có thể xây dựng cho bạn một loại ứng dụng nhỏ tương tác theo thời gian thực: bạn chọn các tùy chọn, thay đổi các tham số và xem những gì xảy ra ngay lập tức, như thể đó là một công cụ nhỏ được thiết kế riêng dựa trên câu hỏi của bạn.
Chế độ Dynamic View của Gemini là gì và nó khác với chế độ văn bản như thế nào?
Khi chúng ta nói về Dynamic View, chúng ta đang đề cập đến Chế độ phản hồi Gemini trong đó nội dung được trình bày trực quan, tương tác và đa phương tiện, thay vì vẫn giữ nguyên trong một khối văn bản thông thường. Google Nó được thiết kế sao cho từ bất kỳ lời nhắc nào, mô hình có thể tạo ra:
- Mô phỏng và công cụ tương tác (ví dụ, các mô hình có thể điều khiển được hoặc hoạt ảnh có thể kiểm soát được).
- Tóm tắt trực quan với các khối, thẻ, bảng và giải thích từng bước.
- Nội dung đa phương tiện tích hợpNhư hình ảnh hỗ trợ hoặc so sánh song song.
Như Google đã giải thích, tùy chọn này Nó cho phép các mô hình AI xây dựng những trải nghiệm nhập vai, thời gian thực theo bất kỳ yêu cầu nào.Điều này có nghĩa là, nếu bạn hỏi về một chủ đề phức tạp, thay vì chỉ đưa ra một chuỗi công thức, nó có thể tạo ra một loại "cảnh" tương tác: thanh trượt để thay đổi giá trị, nút để chuyển đổi chế độ xem, các bước mở rộng, v.v.
Sự khác biệt với mẫu Gemini cổ điển rất rõ ràng: Ở chế độ thông thường, bạn sẽ nhận được văn bản có cấu trúc, có thể có một số hộp hoặc bảngVới Dynamic View, bạn sẽ được trải nghiệm một định dạng trực quan hơn nhiều. Cảm giác giống như việc chuyển từ đọc một bài viết dài sang xem phần giải thích với đồ họa động và các nút điều khiển để tự mình trải nghiệm.
Cách tiếp cận này làm cho AI dễ tiếp cận hơn đối với những người bị lạc với các công thức hoặc văn bản dày đặcThay vì buộc bạn phải tưởng tượng những gì đang xảy ra, nó sẽ hiển thị chúng trên màn hình, với các yếu tố bạn có thể di chuyển hoặc thay đổi để hiểu rõ hơn về ý tưởng.
Cách Dynamic View hoạt động trong thực tế: ví dụ về bài toán ba vật thể

Một trong những ví dụ tốt nhất để hiểu những gì Dynamic View cung cấp có thể được tìm thấy trong hỏi Song Tử về bài toán ba vật thể nổi tiếngĐịnh lý, một công thức kinh điển trong vật lý và cơ học thiên thể, liên quan đến việc tính toán chuyển động của ba vật thể có lực hấp dẫn tương hỗ lẫn nhau (ví dụ, các ngôi sao hoặc hành tinh). Đây là một hệ thống vô cùng phức tạp và hỗn loạn.
Nếu bạn hỏi câu hỏi đó với phiên bản Gemini chỉ trả lời bằng văn bản, câu trả lời thông thường là Nó cung cấp cho bạn một lời giải thích có tổ chức tốt, nhưng lại đầy rẫy các công thức và thuật ngữ kỹ thuật.Với một người không có nền tảng vật lý, điều đó có thể rất ấn tượng… và choáng ngợp. Bạn thấy các phương trình vi phân, biểu thức toán học và định nghĩa về hỗn loạn động lực học chẳng có nghĩa lý gì cả.
Tuy nhiên, khi hỏi chính xác cùng một câu hỏi, nhưng với Dynamic View được bật, AI xây dựng mô phỏng trực quan tương tác mà bạn có thể thao tác.Trong trải nghiệm đó, bạn có thể:
- Chuyển đổi giữa các chế độ mô phỏng khác nhau (ví dụ, xem hệ thống có hai vật thể và sau đó là ba vật thể).
- Điều chỉnh tốc độ để quan sát quỹ đạo tiến triển chậm hơn hay nhanh hơn.
- Xem giải thích ngắn gọn bên cạnh hình ảnh động, làm rõ những gì đang xảy ra trong từng trường hợp.
Đầu tiên, Song Tử dạy bạn một kịch bản đơn giản với hai thiên thể, như Trái Đất và Mặt Trăng, cho thấy quỹ đạo ổn định và tương đối có thể dự đoán đượcSau đó, khi bạn thêm vật thể thứ ba, sự hỗn loạn sẽ xảy ra: quỹ đạo thay đổi đáng kể để đáp ứng với những biến đổi nhỏ trong các điều kiện ban đầu, thường được mô tả là hiệu ứng cánh bướm.
Nhờ cuộc biểu tình này, Điều này giải thích tại sao hệ thống ba sao có xu hướng không ổn định. Và chúng rất khó dự đoán. Trong khi các công thức để lại cảm giác xa vời và bí ẩn, thì mô phỏng lại khiến khái niệm "nắm bắt" trong tâm trí người dùng. Sự khác biệt giữa đọc và nhìn là rất lớn.
Trải nghiệm đó cho thấy rõ thế giới chatbot đang hướng tới đâu: Các cuộc trò chuyện đang trở nên trực quan hơn, tương tác hơn và gần như vui tươi hơn.Bạn thay đổi một tham số, xem mô phỏng thay đổi như thế nào, và trong quá trình đó, củng cố khái niệm trong trí nhớ tốt hơn nhiều. Đây là một cách học tập hấp dẫn vì bạn cảm thấy như mình đang "chơi đùa" với ý tưởng thay vì chỉ ghi nhớ lý thuyết.
Sử dụng thiết kế trực quan và Dynamic View trong Gemini: những gì bạn cần
Để có thể tận hưởng tất cả những điều này, điều quan trọng là phải hiểu rằng Thiết kế trực quan và Chế độ xem động đang được triển khai dần dần.Không phải tất cả người dùng đều có cùng một lựa chọn cùng lúc và Google đang sử dụng giai đoạn này như một cơ sở thử nghiệm để tinh chỉnh trải nghiệm.
Trong thực tế, điều này có nghĩa là Bạn chỉ có thể thấy thiết kế trực quan, chỉ Chế độ xem động hoặc các biến thể khác nhau trong tài khoản của bạn Nó dựa trên cùng một ý tưởng. Google giải thích rõ ràng: các tính năng này đang được triển khai dần dần và trong quá trình thử nghiệm đó, bạn có thể được truy cập vào một hoặc một số phiên bản, nhưng không nhất thiết phải là tất cả.
Ngoài ra, còn có một hạn chế quan trọng: Chế độ xem động hiện chưa có trong ứng dụng di động GeminiNói cách khác, nếu bạn mở Gemini từ thiết bị di động, bạn có thể chỉ sử dụng được chế độ văn bản (hoặc thiết kế cơ bản hơn) và trải nghiệm động hiện tại sẽ bị giới hạn ở phiên bản web hoặc một số trình duyệt nhất định.
Do đó, để tận dụng tối đa Chế độ trực quan và Chế độ xem động, bạn nên sử dụng Gemini trên máy tính để bàn hoặc máy tính xách tay có trình duyệt được cập nhật Và hãy kiên nhẫn trong khi Google hoàn tất việc triển khai. Việc tính năng này xuất hiện rồi biến mất trong vài tuần tùy thuộc vào các thử nghiệm đang diễn ra là điều bình thường.
Cách thức tổ chức thông tin: tab, thẻ và hình ảnh
Một trong những điểm nổi bật của Thiết kế hình ảnh Gemini có phải vậy không Sắp xếp thông tin thành các khối và tab.Thay vì trình bày dưới dạng một văn bản tuyến tính duy nhất, điều này giúp bạn dễ dàng khám phá câu trả lời hơn: bạn chọn phần bạn muốn xem tại bất kỳ thời điểm nào và bạn sẽ không phải đối mặt với một "bức tường" nội dung.
Khi Gemini quyết định sử dụng định dạng này, nó có thể cho bạn thấy một số tab ở đầu câu trả lờiMỗi mục đều đề cập đến một khía cạnh khác nhau của chủ đề: định nghĩa, ví dụ, bối cảnh lịch sử, các bước, v.v. Bạn chỉ cần nhấp vào chúng để truy cập vào phần mà bạn quan tâm mà không bị lạc lối.
Loại cấu trúc này đặc biệt hữu ích khi nội dung rất dày đặc, bởi vì Nó cho phép bạn có được những gì bạn cần một cách nhanh chóng và không căng thẳng.Nếu bạn chỉ quan tâm đến phần tóm tắt, hãy giữ nguyên tab đầu tiên; nếu muốn tìm hiểu sâu hơn, hãy chuyển sang các tab khác. Đây là một phản hồi dạng module hơn nhiều.
Cùng với hệ thống tab này, thiết kế trực quan cũng kết hợp thẻ, danh sách phong phú và các khối thông tin nhỏ có điểm nhấn trực quanBằng cách này, thông tin quan trọng nhất sẽ được làm nổi bật và không bị mất đi giữa những đoạn văn dài vô tận.
Về hình ảnh, Gemini có thể hiển thị các nguồn tài nguyên trực quan hỗ trợ có nguồn gốc, Khi có sẵn, nó sẽ được chỉ ra ở góc trên bên phải của hình ảnh.Trong nhiều trường hợp, bạn sẽ thấy một liên kết hoặc biểu tượng cho phép bạn mở nguồn gốc.
Nếu bạn muốn kiểm tra trang nguồn của một hình ảnh, Bạn có thể nhấp vào tùy chọn "Phóng to" để mở nó trong một tab trình duyệt mớiTừ đó, bạn sẽ có quyền truy cập vào toàn bộ bối cảnh: bài viết, trang web, tác giả, v.v. Đây là cách thuận tiện để xác minh nguồn gốc của nội dung trực quan và tìm hiểu sâu hơn nếu có điều gì đó thu hút sự chú ý của bạn.
Ứng dụng thực tế của Dynamic View: từ xác suất đến thời trang
Khả năng của Dynamic View không chỉ giới hạn ở các ví dụ vật lý. Google đã nói rõ rằng cách tiếp cận này phục vụ cho phạm vi sử dụng gần như không giới hạnvì bất kỳ lời nhắc nào cũng có thể được chuyển đổi thành trải nghiệm trực quan và tương tác nếu mô hình cho là phù hợp.
Ví dụ, khi nghiên cứu lý thuyết xác suất, Gemini có thể hiển thị mô phỏng các trò chơi tung xúc xắc, roulette hoặc các quá trình ngẫu nhiên. được lặp lại nhiều lần trên màn hình. Bằng cách này, bạn thực sự thấy được tần số tương đối hội tụ về các giá trị lý thuyết khi số lượng thử nghiệm tăng lên.
Trong nhiều lĩnh vực đời thường hơn, chẳng hạn như thời trang, Dynamic View có thể sắp xếp các đề xuất về trang phục dưới dạng kết hợp, bảng so sánh hoặc gợi ý về phong cách.Thay vì cung cấp cho bạn một danh sách quần áo khô khan, nó sẽ cho bạn thấy những "kiểu dáng" có thể có, độ tương phản màu sắc và gợi ý phù hợp với những dịp khác nhau.
Nó cũng có thể được sử dụng để ghi nhớ các chi tiết từ phim truyền hình hoặc phim điện ảnh: Nếu bạn hỏi về cái kết của một chương trình như "How I Met Your Mother"Gemini có thể cung cấp cho bạn bản tóm tắt trực quan, hiển thị dòng thời gian đơn giản, các nhân vật chính và những diễn biến chính của cốt truyện mà không cần bạn phải đọc một bản tóm tắt văn bản dài lê thê.
Thậm chí, một số người còn yêu cầu ông giải thích về những bộ phim đặc biệt phức tạp, chẳng hạn như "Tenet". Gemini thậm chí còn đi xa hơn khi tạo ra các chương trình trực quan chi tiết Để cố gắng phá vỡ cấu trúc thời gian của bộ phim, công cụ này sử dụng đồ họa giao thoa giữa các nhân vật, dòng thời gian và sự kiện. Mặc dù không phải ai cũng hiểu hết về nó, nhưng công cụ này cho thấy khả năng thích ứng tốt với những nội dung rất phức tạp.
Tuy nhiên, loại phản ứng này Phải mất nhiều thời gian hơn một vài giây để tạo ra so với các trang web chỉ toàn văn bản.Ứng dụng này không dành cho những người thiếu kiên nhẫn, nhưng khi quá trình tải hoàn tất, thời gian chờ đợi thường là xứng đáng: sự kết hợp giữa tính tương tác và nội dung trực quan khiến thông tin hấp dẫn hơn nhiều và dễ nhớ hơn.
Vai trò của lời nhắc trong thời đại quan điểm năng động
Người ta đã nhắc đi nhắc lại từ lâu rằng Chất lượng nhanh chóng là tất cảNếu bạn không diễn đạt câu hỏi một cách khéo léo, bạn sẽ không nhận được câu trả lời thỏa đáng. Với sự ra đời của chế độ xem động và giao diện trò chuyện, áp lực đó đối với người dùng đang được giảm bớt đáng kể.
Trong các tình huống như chế độ Xem động hoặc Nghiên cứu mua hàng, Lời nhắc ban đầu chỉ là điểm khởi đầuNếu yêu cầu của bạn mơ hồ hoặc không chính xác, hệ thống sẽ tự động đặt câu hỏi, làm rõ bất kỳ thắc mắc nào và bổ sung thông tin còn thiếu. Cuộc trò chuyện trở nên tự nhiên và lặp đi lặp lại hơn nhiều.
Điều này làm cho các mô hình AI dễ tiếp cận hơn đối với những người không muốn hoặc không biết cách viết những lời nhắc rất phức tạpNgay cả khi hướng dẫn ban đầu của bạn khá chung chung, trợ lý vẫn có thể hướng dẫn bạn bằng những câu hỏi đơn giản cho đến khi bạn hình dung rõ ràng hơn về những gì bạn thực sự đang tìm kiếm.
Hơn nữa, bằng cách kết hợp các thành phần trực quan, Có thể giải thích không chỉ bằng lời nói mà còn bằng ví dụ minh họa.Thay vì hỏi bạn "Bạn thích phong cách này hay phong cách kia?" theo dạng văn bản, hệ thống có thể hiển thị cho bạn hai bộ tùy chọn trực quan để lựa chọn, giúp mọi thứ trở nên trực quan hơn nhiều.
Tất cả những điều này chỉ ra sự khởi đầu của một kỷ nguyên mới cho chatbot AI: Các mô hình tò mò hơn, tìm tòi hơn, tập trung nhiều hơn vào việc tạo ra các câu trả lời hữu ích, trực quan, tương tác và giải tríHọ không còn chỉ trả lời câu hỏi của bạn nữa; họ cố gắng hiểu bạn hơn để đưa ra giải pháp thực sự phù hợp với những gì bạn đang nghĩ.
Nhìn từ bên ngoài, sự tiến hóa này có vẻ chỉ là một sự cải thiện về mặt thẩm mỹ, nhưng thực tế nó bao gồm một sự thay đổi sâu sắc trong cách chúng ta liên hệ với công nghệAI không còn chỉ là một "công cụ văn bản" mà là một công cụ tạo ra những trải nghiệm hoàn chỉnh, nơi mà việc nhìn, chạm (kỹ thuật số) và trải nghiệm trở nên quan trọng như việc đọc.
Với các tính năng như Chế độ xem động của Gemini, thiết kế trực quan theo thẻ, mô phỏng thời gian thực và các chế độ tương tác từ các trợ lý khác, Chúng ta đang bước vào giai đoạn mà việc học tập, nghiên cứu hoặc mua sắm với sự trợ giúp của AI trở nên rõ ràng hơn, hấp dẫn hơn và, phải nói là, thú vị hơn rất nhiều. thay vì chỉ ngồi trước một khối văn bản tĩnh đơn giản.
Người viết đam mê về thế giới byte và công nghệ nói chung. Tôi thích chia sẻ kiến thức của mình thông qua viết lách và đó là những gì tôi sẽ làm trong blog này, cho bạn thấy tất cả những điều thú vị nhất về tiện ích, phần mềm, phần cứng, xu hướng công nghệ, v.v. Mục tiêu của tôi là giúp bạn điều hướng thế giới kỹ thuật số một cách đơn giản và thú vị.

