Y tế thế giới
AI trong khoa cấp cứu: đầy hứa hẹn, mạnh mẽ nhưng vẫn chưa được chứng minh
AI in the emergency department: promising, powerful but still unproven
Artificial intelligence can now outperform doctors at diagnosing patients in the emergency department, according to a new study in Science.
Trí tuệ nhân tạo hiện có thể vượt qua bác sĩ trong việc chẩn đoán bệnh nhân tại phòng cấp cứu, theo một nghiên cứu mới trên tạp chí Science.
The AI was given written notes from real emergency department records from a hospital in Boston, US, and asked to weigh in at different points during the patient’s care. At the earliest stage – triage, when a patient first arrives – the AI identified the correct diagnosis, or something closely related, in 67% of cases.
AI được cung cấp các ghi chú bằng văn bản từ hồ sơ thực tế của phòng cấp cứu tại một bệnh viện ở Boston, Mỹ, và được yêu cầu đưa ra ý kiến tại các thời điểm khác nhau trong quá trình chăm sóc bệnh nhân. Ở giai đoạn sớm nhất – sàng lọc (triage) , khi bệnh nhân mới đến – AI đã xác định được chẩn đoán chính xác, hoặc thứ gì đó liên quan chặt chẽ, trong 67% trường hợp.
The two doctors used for comparison managed 50% and 55%. That’s a meaningful gap, especially at the moment when information is scarcest and uncertainty is highest.
Hai bác sĩ được dùng để so sánh đạt tỷ lệ lần lượt là 50% và 55%. Đây là một khoảng cách đáng kể, đặc biệt vào thời điểm thông tin khan hiếm nhất và sự không chắc chắn là cao nhất.
This study matters because the field is moving so fast. Earlier research showed that large language models – the technology behind systems like ChatGPT – could pass medical licensing exams. Interesting, but not all that illuminating. Passing an exam is not the same as being useful on a ward.
Nghiên cứu này quan trọng vì lĩnh vực này đang phát triển rất nhanh. Các nghiên cứu trước đây cho thấy các mô hình ngôn ngữ lớn – công nghệ đằng sau các hệ thống như ChatGPT – có thể vượt qua các kỳ thi cấp phép y khoa. Điều này thú vị, nhưng chưa đủ để khẳng định mọi thứ. Vượt qua kỳ thi không giống với việc hữu ích trên một khoa phòng.
This new study goes further. It puts AI alongside doctors across several tasks, using genuine clinical text from a real emergency department. That makes it more directly relevant to medical practice than most of what’s come before. It suggests these systems are developing into something that could genuinely help doctors think through a wide range of possible diagnoses, especially in situations where missing a serious condition is the main concern.
Nghiên cứu mới này còn đi xa hơn. Nó đặt AI ngang hàng với các bác sĩ qua nhiều nhiệm vụ, sử dụng văn bản lâm sàng thực tế từ một phòng cấp cứu có thật. Điều này khiến nó liên quan trực tiếp hơn đến thực hành y khoa so với hầu hết những gì đã có trước đây. Nó gợi ý rằng các hệ thống này đang phát triển thành thứ có thể thực sự giúp bác sĩ suy nghĩ qua một loạt các chẩn đoán có thể, đặc biệt trong những tình huống mà việc bỏ sót một tình trạng nghiêm trọng là mối quan tâm chính.
There are good reasons, though, not to get carried away.
Tuy nhiên, cũng có những lý do để không quá chủ quan.
The AI was working entirely from written text. It never saw the patient, never noticed how breathless or frightened they looked, never examined them, spoke to their family, weighed up the chaos of a busy department, or took any responsibility for what happened next. It was not practising emergency medicine. It was offering a written opinion based on selected information.
AI hoạt động hoàn toàn dựa trên văn bản viết. Nó chưa bao giờ nhìn thấy bệnh nhân, chưa bao giờ nhận thấy họ thở dốc hay sợ hãi như thế nào, chưa bao giờ khám cho họ, nói chuyện với gia đình họ, cân nhắc sự hỗn loạn của một khoa bận rộn, hay chịu trách nhiệm về những gì xảy ra tiếp theo. Nó không thực hành y học cấp cứu. Nó chỉ đưa ra ý kiến bằng văn bản dựa trên thông tin được chọn lọc.
There’s also a gap between producing a list of possible diagnoses and actually improving patient outcomes. A longer list might help a doctor think more broadly, but it could equally generate new problems: unnecessary tests, over-treatment, extra workload, or unwarranted confidence in an answer that sounds plausible but turns out to be wrong.
Ngoài ra còn có một khoảng cách giữa việc đưa ra một danh sách các chẩn đoán có thể và việc thực sự cải thiện kết quả điều trị cho bệnh nhân. Một danh sách dài hơn có thể giúp bác sĩ suy nghĩ rộng hơn, nhưng nó cũng có thể tạo ra những vấn đề mới: các xét nghiệm không cần thiết, điều trị quá mức, khối lượng công việc tăng thêm, hoặc sự tự tin không đáng có vào một câu trả lời nghe có vẻ hợp lý nhưng thực chất lại sai.
And some of the benchmark cases used in studies like this may have been publicly available when the AI was trained, which doesn’t undermine the emergency department findings, but is another reason to treat headline numbers with some scepticism.
Và một số trường hợp chuẩn được sử dụng trong các nghiên cứu như thế này có thể đã được công khai khi AI được huấn luyện, điều này không làm giảm tính xác thực của các phát hiện tại phòng cấp cứu, nhưng là một lý do khác để chúng ta cần xem xét các con số tiêu đề với một chút hoài nghi.
The hard question
Câu hỏi khó
So the question isn’t really whether AI can help doctors think through difficult cases. The harder question is how this should be tested and governed in real clinical settings like the NHS.
Vậy nên câu hỏi không thực sự là liệu AI có thể giúp bác sĩ suy nghĩ về các trường hợp khó hay không. Câu hỏi khó hơn là cách thức nó nên được thử nghiệm và quản lý trong các môi trường lâm sàng thực tế như NHS.
That question is already urgent. A Royal College of Physicians snapshot found that 16% of UK doctors were using AI tools in clinical practice every day, with another 15% doing so weekly. Doctors are already using these tools in their daily work – before hospitals and health systems have properly worked out how to assess them, train staff to use them safely, spot when they’re causing harm, or decide who is responsible when something goes wrong.
Câu hỏi đó đã rất cấp bách. Một báo cáo nhanh của Royal College of Physicians cho thấy 16% bác sĩ Vương quốc Anh đang sử dụng các công cụ AI trong thực hành lâm sàng hàng ngày, và thêm 15% làm điều đó hàng tuần. Các bác sĩ đã sử dụng những công cụ này trong công việc hàng ngày của họ – trước khi các bệnh viện và hệ thống y tế xác định rõ cách đánh giá chúng, đào tạo nhân viên sử dụng chúng an toàn, phát hiện khi chúng gây hại, hoặc quyết định ai chịu trách nhiệm khi có điều gì đó sai sót.
It’s tempting to say that the solution is to keep a human in the loop. But that phrase does very little work on its own. We need to know which human, in which loop, and with what authority. A doctor’s ability to override an AI suggestion is not, by itself, a safety system. Someone still has to decide which tools get used, who can change how they behave, how harms are spotted, and who is responsible when the tool quietly starts failing.
Người ta có xu hướng cho rằng giải pháp là giữ con người trong vòng lặp (human in the loop) . Nhưng cụm từ đó tự nó không mang lại nhiều giá trị. Chúng ta cần biết con người nào, trong vòng lặp nào, và với thẩm quyền gì. Khả năng bác sĩ ghi đè lên gợi ý của AI tự nó không phải là một hệ thống an toàn. Vẫn phải có người quyết định công cụ nào được sử dụng, ai có thể thay đổi cách chúng hoạt động, cách thức gây hại được phát hiện, và ai chịu trách nhiệm khi công cụ đó bắt đầu trục trặc một cách âm thầm.
This study represents genuine progress. But it doesn’t, on its own, change how medicine should be practised. The right response is neither to prohibit these systems nor to let them quietly become part of the routine before anyone has thought it through. They should be trialled in real clinical settings, used as a form of second-opinion support rather than a substitute for clinical judgment, and measured against what actually matters to patients: care that is better, safer and faster.
Nghiên cứu này đại diện cho một tiến bộ thực sự. Nhưng bản thân nó không thay đổi cách thức thực hành y học. Phản ứng đúng đắn không phải là cấm các hệ thống này, cũng không phải là để chúng âm thầm trở thành một phần của thói quen trước khi bất kỳ ai suy nghĩ thấu đáo. Chúng nên được thử nghiệm trong các môi trường lâm sàng thực tế, được sử dụng như một hình thức hỗ trợ ý kiến thứ hai thay vì thay thế cho phán đoán lâm sàng, và được đánh giá dựa trên những gì thực sự quan trọng đối với bệnh nhân: sự chăm sóc tốt hơn, an toàn hơn và nhanh hơn.
Ewen Harrison receives funding from a number of grant-giving bodies including UKRI, NIHR, HDRUK, and Wellcome Leap. He is a Deputy Editor with NEJM AI.
Ewen Harrison nhận tài trợ từ nhiều tổ chức cấp quỹ bao gồm UKRI, NIHR, HDRUK và Wellcome Leap. Ông là Phó Biên tập viên của NEJM AI.
-
Cách nanomedicine đi vào tế bào và điều trị bạn từ bên trong
How nanomedicine gets inside your cells and treats you from the inside out
-
Khoảng cách đến bệnh viện hoặc phòng khám gần nhất của bạn là bao xa? Các nhà nghiên cứu y tế công cộng giải thích tại sao Châu Phi cần cơ sở dữ liệu cơ sở y tế cập nhật
How far is your closest hospital or clinic? Public health researchers explain why Africa needs up-to-date health facility databases
-
Tòa án Tối cao củng cố quyền tự do ngôn luận của nhà tài trợ trong phán quyết nhất trí về trung tâm thai sản khủng hoảng
Supreme Court bolsters donors’ free speech rights in unanimous crisis pregnancy center ruling
-
Tắc động mạch cảnh nội tiến triển trong bệnh liên quan IgG4: Báo cáo ca bệnh và tổng quan tài liệu
Progressive Internal Carotid Artery Occlusion in IgG4-Related Disease: A Case Report and Literature Review
-
Đau thượng vị không điển hình phát hiện nhiễm trùng niệu tắc nghẽn ở thận phân thuỳ
Atypical Epigastric Pain Reveals Obstructive Urosepsis in a Horseshoe Kidney
-