DeepL mua lại Mixhalo nhằm cách mạng hóa việc dịch âm thanh tại các sự kiện trực tiếp

DeepL đang mở rộng dấu ấn công nghệ của mình vượt ra ngoài phạm vi dịch thuật văn bản và tài liệu bằng cách mua lại Mixhalo, một startup về âm thanh thời gian thực. Bước đi chiến lược này nhằm mục đích tích hợp truyền phát âm thanh độ trung thực cao với dịch thuật AI tiên tiến để giải quyết những thách thức phức tạp của các sự kiện trực tiếp đa ngôn ngữ.

Thu hẹp khoảng cách giữa truyền phát âm thanh và dịch thuật AI

Trong nhiều năm, DeepL đã là một thế lực thống trị trong lĩnh vực dịch thuật dựa trên văn bản, nhưng công ty đã quyết liệt chuyển hướng sang các công nghệ giọng nói. Vào năm 2024, DeepL đã ra mắt khả năng chuyển đổi giọng nói thành văn bản (voice-to-text) trên 33 ngôn ngữ, tiếp theo là bộ công cụ dịch thuật giọng nói sang giọng nói (voice-to-voice) được thiết kế cho các cuộc họp đa ngôn ngữ.

Việc mua lại Mixhalo, được thành lập vào năm 2016 bởi Mike Einziger, Ann Marie Simpson-Einziger và Vik Singh, cung cấp lớp phần cứng và phần mềm còn thiếu cần thiết cho các môi trường trực tiếp. Mặc dù Mixhalo bắt đầu bằng việc cải thiện trải nghiệm âm thanh tại các buổi hòa nhạc, công ty đã phát triển thành một thế lực về âm thanh thời gian thực trong thể thao và các sự kiện trực tiếp quy mô lớn. Bằng cách kết hợp khả năng truyền phát âm thanh độ trễ thấp của Mixhalo với các mô hình dịch thuật của DeepL, công ty hiện có thể cung cấp trải nghiệm liền mạch cho các diễn giả chính và các buổi thảo luận nhóm, nơi mà các ứng dụng dịch thuật truyền thống thường thất bại do khoảng cách và tiếng ồn xung quanh.

Mở rộng chiến lược vào thị trường Hoa Kỳ

Bên cạnh sự cộng hưởng về công nghệ, thương vụ thâu tóm này còn đóng vai trò là một bước đi chiến lược về mặt địa lý của DeepL. Bằng cách mua lại Mixhalo có trụ sở tại San Francisco, DeepL đang thiết lập sự hiện diện vật lý tại khu vực Vịnh (Bay Area) để mở rộng các hoạt động tại Hoa Kỳ.

CEO của DeepL, Jarek Kutylowski, lưu ý rằng Mixhalo sẽ đóng vai trò vừa là một giải pháp kỹ thuật, vừa là một trường hợp sử dụng tiếp thị có sức ảnh hưởng lớn. Các hội nghị trực tiếp và các sự kiện thể thao khổng lồ cung cấp môi trường thử nghiệm "thực tế" hoàn hảo để chứng minh công nghệ của DeepL hoạt động như thế nào trong thời gian thực dưới áp lực. Bước đi này giúp DeepL có vị thế để cạnh tranh trực tiếp hơn với các đối thủ chuyên biệt như Wordly AI và Palabra trong thị trường dịch thuật trực tiếp đang bùng nổ.

Điều hướng bối cảnh AI đầy cạnh tranh

Thương vụ thâu tóm này cũng phản ánh sự thay đổi về mặt kinh tế của ngành công nghiệp AI. CEO của Mixhalo, Vik Singh, nhấn mạnh rằng mặc dù sự bùng nổ của các mô hình giọng nói sẵn có mang lại lợi ích cho việc kiểm tra hiệu suất, nhưng quy mô ngày càng tăng của các nhà cung cấp mô hình lớn đang đe dọa "xâm lấn" vào thị trường ngách của Mixhalo. Khi các công ty AI quy mô lớn tích hợp các khả năng về giọng nói, các startup chuyên biệt phải đối mặt với áp lực cạnh tranh gay gắt về giá.

Bằng cách hợp lực, Mixhalo có được nguồn lực tính toán và phát triển mô hình khổng lồ của DeepL, trong khi DeepL có được một lớp ứng dụng chuyên biệt giúp chuyển đổi API của mình từ một công cụ kỹ thuật số thành một trải nghiệm thực tế đầy sống động. Sự tích hợp này đại diện cho một sự chuyển dịch trong bối cảnh AI: chuyển từ mô hình phần mềm dưới dạng dịch vụ (SaaS) thuần túy sang các trải nghiệm cảm giác tích hợp theo thời gian thực.

Những điểm chính