Apple PARS: Đây là cách Apple muốn đọc hoạt động não của bạn thông qua tai.

Cập nhật lần cuối: 04/12/2025
tác giả: Isaac
  • Apple PARS là phương pháp tự học có thể tìm hiểu cấu trúc thời gian của tín hiệu EEG mà không cần dữ liệu chú thích.
  • Phương pháp này kết hợp điện não đồ (EEG) và tai nghe được cấp bằng sáng chế có điện cực để đo hoạt động não từ tai.
  • Các mô hình được đào tạo bằng PARS có hiệu suất tương đương hoặc vượt trội hơn các phương pháp trước đây trong các nhiệm vụ như giấc ngủ, động kinh hoặc EEG bất thường.
  • Công nghệ này có thể giúp AirPods trong tương lai có khả năng theo dõi sức khỏe và tinh thần của não bộ hàng ngày.

Apple PARS AI EEG

Ý tưởng rằng tai nghe có thể Hãy lắng nghe âm nhạc của bạn và đồng thời "lắng nghe" bộ não của bạn Có vẻ như là một thứ gì đó trong khoa học viễn tưởng, nhưng Apple đã mở đường bằng một sự kết hợp rất mạnh mẽ: cảm biến trong tai mới và các mô hình tiên tiến của trí tuệ nhân tạoĐằng sau tất cả những điều này là một phương pháp được gọi là PARS (Chuyển dịch tương đối theo PAirwise), một phương pháp tự học cho phép thuật toán hiểu được hoạt động điện của não mà không cần dựa vào các chuyên gia ghi lại dữ liệu theo cách thủ công.

Thay vì tập trung vào một tiện ích cụ thể, nghiên cứu của Apple tập trung vào cách một mô hình IA có thể tìm hiểu cấu trúc thời gian của tín hiệu EEG (điện não đồ) và sau đó áp dụng kiến ​​thức đó vào các nhiệm vụ như phân loại các giai đoạn giấc ngủ hoặc phát hiện các bất thường về thần kinh. Và, mặc dù nghiên cứu không đề cập trực tiếp đến AirPods, nhưng nó bổ sung thêm bằng sáng chế và nguyên mẫu cho thấy tương lai mà tai nghe đơn giản có thể trở thành một loại "phòng thí nghiệm thu nhỏ" để theo dõi não bộ từ tai.

Apple PARS (Pairwise Relative Shift) là gì và tại sao nó lại quan trọng đến vậy?

Thuật toán Apple PARS

Phương pháp PARS bắt nguồn từ nghiên cứu được trình bày bởi một nhóm từ Apple và các cộng tác viên học thuật, trong một bài báo được chấp nhận tại Hội thảo Mô hình Nền tảng cho Não bộ và Cơ thể NeurIPS 2025Nghiên cứu có tên "Học thành phần tương đối của tín hiệu EEG bằng cách sử dụng phương pháp đào tạo trước dịch chuyển tương đối từng cặp" đề xuất một cách khác để đào tạo các mô hình bằng tín hiệu điện não đồ mà không cần sử dụng nhãn của con người.

Trong thực tế, PARS là một kỹ thuật học tập tự giám sát áp dụng cho EEG. Thay vì yêu cầu các bác sĩ thần kinh chỉ ra thủ công đoạn tín hiệu nào tương ứng với từng giai đoạn ngủ hoặc thời điểm bắt đầu cơn động kinh, mô hình được huấn luyện với dữ liệu chưa được chú thích và buộc phải giải một bài toán nhân tạo nhưng rất hữu ích: dự đoán khoảng cách thời gian giữa hai đoạn tín hiệu.

Ý tưởng cơ bản là nếu mô hình học cách ước tính khoảng thời gian giữa hai cửa sổ EEG, cuối cùng nó sẽ hiểu được cấu trúc toàn cầu và sự phụ thuộc tầm xa của hoạt động não. Điều này sau đó cho phép nó hoạt động tốt hơn trong các nhiệm vụ lâm sàng thực tế, chẳng hạn như phát hiện các kiểu ngủ, xác định bệnh động kinh hoặc nhận dạng tín hiệu vận động.

Các tác giả nhấn mạnh rằng, trái ngược với các phương pháp tự học EEG cổ điển, chủ yếu tập trung vào tái tạo các phần bị che khuất của tín hiệu (giống như bộ mã hóa tự động có mặt nạ, MAE), PARS tập trung vào thành phần thời gian tương đối. Nghĩa là, nó không chỉ lấp đầy các "khoảng trống" cục bộ mà còn nắm bắt cách các đoạn tín hiệu riêng biệt khớp với nhau theo thời gian.

Trong các thử nghiệm được thực hiện, các mô hình dựa trên PARS cho thấy rằng chúng có khả năng để phù hợp hoặc vượt qua các chiến lược trước đó trong một số chuẩn EEG, đặc biệt là khi có ít nhãn (một tình huống rất phổ biến trong y học). Điều này khiến PARS trở thành một lựa chọn rất hấp dẫn cho bất kỳ hệ thống nào muốn tận dụng khối lượng lớn tín hiệu não mà không cần dựa vào các chú thích đầy đủ.

Cách thức hoạt động của PARS: từ mã hóa đến ước tính độ dịch chuyển tương đối

Chức năng PARS trong EEG

Để áp dụng phương pháp PARS vào EEG, các nhà nghiên cứu thiết kế một kiến ​​trúc dựa trên Máy biến áp có một số bước chínhMọi thứ bắt đầu bằng việc xử lý trước tín hiệu và chuyển đổi nó thành dạng biểu diễn mà mô hình có thể xử lý dễ dàng.

Đầu tiên, tín hiệu EEG được chia thành cửa sổ tạm thời hoặc "mã thông báo"Quá trình mã hóa này cho phép mỗi phần tín hiệu được biểu diễn như một đơn vị mà bộ biến đổi có thể hoạt động, tương tự như cách sử dụng văn bản hoặc hình ảnh. Các mã thông báo này sau đó được thêm vào... vị trí nhúng, mặc dù theo một cách đặc biệt, vì PARS hoạt động chính xác với mặt nạ và sự thao túng các vị trí thời gian này.

Một trong những thành phần đặc biệt của phương pháp này là việc sử dụng nhúng vị trí có mặt nạThay vì cung cấp cho mô hình thông tin vị trí chính xác trực tiếp trong el tiempo Đối với mỗi mã thông báo, một số dữ liệu vị trí nhất định sẽ bị ẩn hoặc thay đổi. Điều này buộc bộ mã hóa phải suy ra cấu trúc thời gian từ nội dungkhông chỉ dựa vào chỉ mục hoặc dấu thời gian rõ ràng.

  Cách tạo Genmoji trên iPhone bằng Apple Intelligence: Hướng dẫn đầy đủ

Nhiệm vụ cốt lõi của bài tập trước khi tập luyện PARS là ước tính dịch chuyển tương đối theo cặpMô hình nhận được hai cửa sổ EEG được trích xuất ngẫu nhiên từ cùng một bản ghi và phải dự đoán khoảng cách thời gian giữa chúng. Vấn đề không chỉ là đoán xem chúng gần hay xa nhau, mà còn là học một phép ánh xạ liên tục hoặc rời rạc phản ánh khoảng thời gian tương đối.

Đối với điều này, một bộ giải mã với cơ chế chú ý chéoThành phần này tham chiếu chéo thông tin được mã hóa từ cả hai cửa sổ và học cách liên hệ các đặc điểm nội tại của chúng để suy ra thời gian phân tách chúng. Nhờ quá trình này, bộ chuyển đổi cuối cùng sẽ mô hình hóa các mối quan hệ phụ thuộc dài hạn và các mô hình tiến hóa hoạt động não bộ vượt xa môi trường cục bộ chỉ vài mili giây.

Trong các giai đoạn sau, mô hình được điều chỉnh cho phù hợp với các nhiệm vụ khác nhau thông qua điều chỉnh đa kênh và đánh giá cụ thểĐiều này có nghĩa là, một khi đã được đào tạo trước với PARS trên nhiều bản ghi EEG khác nhau (bao gồm cả thiết lập nhiều điện cực), nó sẽ được tinh chỉnh cho các nhiệm vụ cụ thể như phân loại giấc ngủ, phát hiện điện não đồ bất thường hoặc cơn động kinh.

Bài viết kỹ thuật cũng trình bày chi tiết các khía cạnh thực tế như các tập dữ liệu được sử dụng, kiến ​​trúc chính xác của bộ mã hóa, loại bộ giải mã được chọn, các lược đồ lấy mẫu mặt nạ và bản vácũng như tài nguyên máy tính được sử dụngNgoài ra, các biến thể kiến ​​trúc khác nhau được so sánh với các nghiên cứu cắt bỏ để xác định quyết định thiết kế nào mang lại hiệu suất tốt nhất.

So sánh với các phương pháp khác: MAE, MP3, DropPos và các phương pháp khác

So sánh PARS với các mô hình khác

Nghiên cứu này không chỉ đơn thuần mô tả PARS mà còn so sánh nó với Phương pháp tham khảo trong tự học EEGTrong số các cách tiếp cận được so sánh có bộ mã hóa tự động có mặt nạ (MAE), MP3 và DropPos, mỗi loại có triết lý khác nhau khi nói đến việc học từ dữ liệu chưa được gắn nhãn.

MAE tập trung vào tái tạo các phần bị che khuất của tín hiệuTrong quá trình tiền huấn luyện, một số phần của dữ liệu đầu vào bị ẩn đi, và mô hình cố gắng khôi phục chúng từ ngữ cảnh. Điều này buộc bộ mã hóa phải học các biểu diễn có ý nghĩa, nhưng lại thiên về các mẫu cục bộ - tức là lấp đầy các "khoảng trống" gần đó thay vì hiểu các mối quan hệ dài hạn.

MP3 và các phương pháp tương tự khác cũng khám phá chiến lược viện cớ để nắm bắt thông tin cấu trúcTuy nhiên, theo kết quả của bài báo, chúng vẫn kém hiệu quả hơn PARS trong việc mô hình hóa các khoảng thời gian tương đối giữa các phân đoạn tín hiệu xa nhau.

DropPos, về phần mình, sửa đổi hoặc loại bỏ thông tin vị trí rõ ràng trong máy biến áp với ý tưởng làm cho mô hình mạnh mẽ hơn ở vị trí chính xácMặc dù loại kỹ thuật này giúp mạng không phụ thuộc quá nhiều vào nhúng vị trí, nhưng đã được chứng minh rằng, tự nó không đủ để khai thác tối ưu cấu trúc thời gian của tín hiệu EEG.

Các thử nghiệm thực nghiệm chứng minh rằng các mô hình được đào tạo trước với PARS bằng hoặc vượt trội hơn các lựa chọn thay thế này trong ba trong bốn chuẩn EEG được sử dụng. Nó tỏa sáng nhất trong các tình huống hiệu quả nhãnNghĩa là, khi chỉ có một phần nhỏ các bản ghi có sẵn. Điều này rất quan trọng trong môi trường lâm sàng, nơi việc ghi nhãn chính xác từng phút EEG rất tốn thời gian và đòi hỏi các chuyên gia chuyên môn.

Phụ lục của tác phẩm mô tả chi tiết cấu hình của từng đường cơ sở, các siêu tham số đã thử nghiệm, tác động của các mức mặt nạ khác nhau hoặc các kiến ​​trúc bộ giải mã khác nhau và kết quả định lượng cuối cùng. Thông điệp rõ ràng là, đối với EEG, việc học rõ ràng mối quan hệ thời gian giữa các đoạn tín hiệu mang lại lợi thế thực tế hơn so với việc chỉ tái tạo hoặc che giấu.

Bộ dữ liệu được sử dụng: từ giấc ngủ EEG tai đến phát hiện động kinh

Bộ dữ liệu điện não đồ tai và động kinh

Để xác thực PARS, Apple và các cộng tác viên đã sử dụng bốn tập dữ liệu EEG nổi tiếngbao gồm nhiều tình huống sử dụng khác nhau: giấc ngủ, bệnh lý, hoạt động vận động và thậm chí cả cấu hình điện cực trong tai.

Tập dữ liệu đầu tiên là Thiết bị theo dõi giấc ngủ đeo được (EESM17), tập trung vào việc theo dõi giấc ngủ bằng thiết bị đeo. Bao gồm các bản ghi âm ban đêm của 9 đối tượng bằng hệ thống theo dõi giấc ngủ. Điện não đồ tai 12 kênh và điện não đồ da đầu 6 kênhBộ dữ liệu này đặc biệt thú vị vì nó chứng minh rằng các điện cực đặt trong tai có thể ghi lại một phần đáng kể hoạt động của não liên quan đến việc phân biệt các giai đoạn giấc ngủ.

  Người quản lý dữ liệu tổng hợp thực sự làm những công việc gì?

Thứ hai là TUAB (Dữ liệu EEG bất thường của Đại học Temple), một ngữ liệu được thiết kế cho phát hiện điện não đồ bất thườngNó thu thập các hồ sơ được dán nhãn là bình thường hoặc bệnh lý, hữu ích cho việc đào tạo các mô hình phát hiện những thay đổi thần kinh nói chung, ngoài một tình trạng cụ thể.

Thứ ba, TUSZ (Tập hợp thu giữ của Đại học Temple), tập trung vào phát hiện cơn động kinhNó bao gồm các chú thích đánh dấu thời điểm bắt đầu và kết thúc cơn động kinh, cũng như các phân đoạn giữa các cơn. Đây là một trong những bộ dữ liệu tham khảo về động kinh để đánh giá các thuật toán AI.

Cuối cùng, tập dữ liệu thứ tư là PhysioNet-MI, tập trung vào nhiệm vụ tưởng tượng vận độngTrong trường hợp này, người tham gia tưởng tượng các chuyển động (ví dụ, chuyển động bàn tay) trong khi ghi lại EEG, cho phép đào tạo các mô hình nhận dạng các mẫu liên quan đến ý định chuyển động, một yếu tố quan trọng trong giao diện não-máy.

Quá trình huấn luyện trước PARS được thực hiện trên các tập dữ liệu này và các tập dữ liệu khác được mô tả trong phụ lục kỹ thuật, trong khi việc tinh chỉnh được điều chỉnh cho phù hợp với các tác vụ cụ thể trong từng tập dữ liệu. Việc lựa chọn các điểm chuẩn đa dạng như vậy minh họa cho phương pháp tiếp cận Nó không giới hạn ở một trường hợp sử dụng duy nhất và có thể dùng làm cơ sở chung cho các mô hình EEG tự theo dõi.

Ear-EEG và AirPods: Nghiên cứu PARS kết nối với tai nghe của Apple như thế nào

Một khía cạnh đặc biệt nổi bật của toàn bộ chủ đề này là việc sử dụng điện não đồ tai, tức là việc thu thập các tín hiệu não từ taiBộ dữ liệu EESM17 hiện đang sử dụng các hệ thống đặt điện cực vào ống tai và tai thay vì trên da đầu, giúp giảm đáng kể tác động trực quan và cải thiện sự thoải mái.

Trong khi đó, các tài liệu công khai và bằng sáng chế của Apple cho thấy công ty đã khám phá trong một thời gian tai nghe có khả năng đo tín hiệu sinh học từ tai. Trong đơn xin cấp bằng sáng chế năm 2023, công ty mô tả một "thiết bị điện tử đeo được" được thiết kế để ghi lại hoạt động của não bằng cách sử dụng các điện cực nằm trong hoặc xung quanh tai, như một giải pháp thay thế ít thấy hơn so với hệ thống EEG da đầu cổ điển.

Bản thân bằng sáng chế thừa nhận rằng các giải pháp EEG tai thông thường thường yêu cầu thiết bị được tùy chỉnh cho từng người dùng (được thiết kế riêng theo kích thước và hình dạng tai, ống tai, v.v. của bạn), vừa tốn kém vừa không thực tế. Hơn nữa, ngay cả thiết bị được thiết kế riêng cũng có thể bị mất tiếp xúc với da theo thời gian, làm giảm chất lượng tín hiệu.

Để giải quyết những thách thức này, Apple đề xuất một giải pháp trong tài liệu đó dựa trên việc đặt nhiều điện cực hơn mức cần thiết, phân bổ khắp taivà để mô hình AI xác định mô hình nào cung cấp kết quả đọc tốt nhất tại bất kỳ thời điểm nào. Để làm được điều này, các số liệu như trở kháng, mức độ nhiễu, chất lượng tiếp xúc da hoặc khoảng cách giữa điện cực hoạt động và điện cực tham chiếu.

Sau khi các số liệu này được tính toán, hệ thống sẽ chỉ định trọng lượng khác nhau cho mỗi điện cực và kết hợp các tín hiệu của nó thành một dạng sóng tối ưu duy nhất. Bằng sáng chế thậm chí còn bao gồm các cử chỉ đơn giản, chẳng hạn như nhấn hoặc bóp ống nghe, để bắt đầu hoặc dừng phép đo, cũng như các biến thể thiết kế và lắp ráp khác nhau sẽ làm cho phần cứng.

Từ lý thuyết đến sản phẩm: cảm biến trong AirPods và theo dõi não bộ hàng ngày

Sự kết hợp của dòng nghiên cứu này với PARS làm cho việc hình dung trở nên khá dễ dàng AirPods có cảm biến có khả năng đo điện não đồ từ ống taiTrên thực tế, đã có những tiến bộ theo hướng đó: AirPods Pro 3 đã tích hợp cảm biến đo thể tích bằng quang kế (PPG) để đo nhịp tim và Apple đã bổ sung các tính năng theo dõi sức khỏe vào thiết bị đeo của mình trong vài năm qua.

Nếu chúng ta thêm vào các điện cực này cho EEG tai và một mô hình tự giám sát như PARS có khả năng giải thích các tín hiệu mà không cần chính cơ sở dữ liệu đã lưu ýKết quả sẽ là một thiết bị có thể phát hiện các giai đoạn giấc ngủ, những thay đổi về sự chú ý hoặc các dấu hiệu ban đầu của một số bệnh lý thần kinh, tất cả đều minh bạch đối với người dùng.

Trong các thí nghiệm được mô tả trong bài nghiên cứu, thuật toán PARS thực hiện các phân đoạn ngẫu nhiên của tín hiệu não và học cách dự đoán khoảng cách thời gian giữa chúngDựa trên khả năng này, mô hình phát triển sự hiểu biết sâu sắc hơn về cách hoạt động của não bộ phát triển theo thời gian, mang lại kết quả tốt hơn khi phân loại các giai đoạn giấc ngủ, xác định các sự kiện động kinh hoặc phân biệt điện não đồ bình thường và bất thường.

Điểm hấp dẫn lớn nhất của phương pháp này là nó có thể hoạt động trong bối cảnh nhãn mác khan hiếm. Trong một sản phẩm thương mại, điều đó có nghĩa là AirPods được trang bị công nghệ này sẽ có thể thích ứng với từng người dùng với rất ít thông tin được giám sát, tận dụng lượng lớn tín hiệu thô thu được trong quá trình sử dụng hàng ngày.

  Grok 4.20: Trí tuệ nhân tạo đa tác nhân muốn thay đổi luật chơi

Theo kết quả nghiên cứu, các mô hình được đào tạo trước với PARS đạt để phù hợp hoặc vượt quá độ chính xác của các phương pháp trước đó trong nhiều nhiệm vụ khác nhau và điều này mở ra cánh cửa cho các thiết bị tiêu dùng, chẳng hạn như tai nghe, bắt đầu cung cấp các phép đo trước đây chỉ dành riêng cho các thiết bị bệnh viện chuyên dụng và cồng kềnh.

Tất nhiên, tất cả những điều này đi kèm với những câu hỏi hợp lý về quyền riêng tư và bảo mật dữ liệu và các ranh giới đạo đức. Ý tưởng rằng AI không chỉ có thể biết nhịp tim hay số bước chân hàng ngày của bạn, mà còn cả các mô hình hoạt động não bộ, gây ra một số lo ngại nhất định. Hiện tại, cả bài báo và bằng sáng chế vẫn đang trong giai đoạn nghiên cứu và thiết kế ý tưởng, chưa có ngày cụ thể cho một sản phẩm thương mại.

Các ứng dụng tiềm năng: sức khỏe, thể chất, lái xe và hiệu suất nhận thức

Nếu công nghệ PARS và EEG dựa trên tai được ứng dụng trong AirPods hoặc các thiết bị đeo khác trong tương lai, phạm vi ứng dụng có thể rất rộng. Thứ nhất, nó sẽ lý tưởng cho theo dõi giấc ngủ liên tục và thoải mái, tự động phân loại các giai đoạn REM và NREM (NREM 1, NREM 2 và NREM 3) và cung cấp thông tin chi tiết về chất lượng nghỉ ngơi.

Hơn nữa, việc phát hiện mức độ chú ý, các đợt căng thẳng hoặc trạng thái cảnh giác Điều này sẽ cực kỳ hữu ích trong các tình huống như lái xe, làm việc trí óc căng thẳng hoặc học tập. Một thiết bị phát hiện sự mất tập trung đột ngột có thể cảnh báo người dùng khi họ có nguy cơ ngủ gật khi lái xe hoặc mắc lỗi nghiêm trọng do mệt mỏi.

Trong bối cảnh lâm sàng, việc theo dõi não bộ liên tục và kín đáo có thể tạo điều kiện thuận lợi phát hiện sớm các rối loạn như động kinh, rối loạn giấc ngủ hoặc các bệnh thoái hóa thần kinhVấn đề không phải là thay thế bác sĩ thần kinh hay bệnh viện, mà là cung cấp dữ liệu có giá trị có thể đóng vai trò cảnh báo sớm hoặc bổ sung cho chẩn đoán.

Một dòng thú vị khác là phản hồi sinh học tập trung vào sức khỏe tinh thầnNếu thiết bị có thể liên hệ một số mẫu EEG nhất định với trạng thái thư giãn, tập trung sâu hoặc căng thẳng, nó có thể hướng dẫn người dùng thực hiện các bài tập thở, thiền hoặc rèn luyện nhận thức, cung cấp các chỉ số thời gian thực về việc liệu các bài tập này có mang lại hiệu quả mong muốn hay không.

Nó sẽ không chỉ dừng lại ở bộ não. Các tài liệu công khai của Apple đề cập đến khả năng bổ sung cảm biến để đo thể tích máu, hoạt động của cơ mặt và chuyển động của mắt từ chính tai nghe. Kết hợp với tín hiệu EEG và được xử lý trong iPhone hoặc một thiết bị khác, dữ liệu này có thể cung cấp cho các mô hình AI có khả năng cung cấp bức tranh rất đầy đủ về trạng thái sinh lý và cảm xúc của người dùng.

Tất cả những cách sử dụng này sẽ phải đi kèm với kiểm soát chặt chẽ sự đồng ý, quản lý dữ liệu và quyền truy cập của bên thứ baTrong các ví dụ được trình bày, giả định rằng thông tin chỉ có thể được chia sẻ với các chuyên gia chăm sóc sức khỏe nếu người dùng cho phép và phần lớn quá trình xử lý được thực hiện tại địa phương để giảm thiểu rủi ro.

Trên thực tế, cả bài báo PARS và các bằng sáng chế và nguyên mẫu đều cho thấy một sự hội tụ rất rõ ràng: Apple đang khám phá, một mặt, cách tốt nhất để thu thập tín hiệu não từ tai và mặt khác cách tốt nhất để diễn giải chúng bằng AI mà không cần dựa vào chú thích của con ngườiNếu cả hai phần này kết hợp với nhau, tai nghe có thể không còn là máy phát âm thanh đơn thuần nữa mà trở thành công cụ chăm sóc sức khỏe và hiệu suất tiên tiến, với điều kiện các khía cạnh đạo đức và quyền riêng tư được quản lý tốt.

Mọi thứ đều chỉ ra rằng chúng ta đang ở giai đoạn đầu của một thế hệ thiết bị đeo mới trong đó các phương pháp như Apple PARS (Parwise Relative Shift) và các cảm biến rời rạc như EEG tai Chúng có thể thay đổi cách chúng ta hiểu về giấc ngủ, sự chú ý và sức khỏe thần kinh của mình, bắt đầu từ những thứ thường ngày như AirPods.

Semantic Scholar là gì?
Bài viết liên quan:
Semantic Scholar là gì: một công cụ tìm kiếm học thuật được hỗ trợ bởi AI