
AI Engineer STT / ASR, Speech / Audio ML, Python, API
TRUONG MINH THINH TECHNOLOGY JOINT STOCK COMPANY
Job Description
TMT là công ty tiên phong cung cấp giải pháp công nghệ SaaS tại Việt Nam. Với sự tin tưởng của hơn 5.000 khách hàng, TMT dẫn đầu trong việc ứng dụng công nghệ vào các lĩnh vực SME, E - commerce,... thông qua các sản phẩm phần mềm như: TPOS, TDental,… nhằm giúp khách hàng quản lý và tối ưu hóa hoạt động kinh doanh.
Đội ngũ kỹ sư giàu kinh nghiệm tại TMT luôn cải tiến sản phẩm bằng cách nghiên cứu và áp dụng các công nghệ mới nhất với mong muốn mang đến những giải pháp có giá trị thực sự cho khách hàng.
Hiện tại TMT đang tìm kiếm vị trí AI Engineer STT có kinh nghiệm vững vàng trực tiếp tham gia vào các dự án phát triển phần mềm cùng với đội ngũ phát triển sản phẩm của TMT.
Tổng quan công việc:
- STT Engineer chịu trách nhiệm nghiên cứu, phát triển và triển khai các hệ thống Speech-to-Text (STT).
- Vị trí này tập trung vào phát triển mô hình nhận dạng giọng nói (ASR/STT), tối ưu hóa độ chính xác và hiệu suất, xây dựng pipeline inference real-time, và đảm bảo chất lượng production-grade cho các sản phẩm Voice AI.
Mô tả công việc:
- Nghiên cứu và phát triển mô hình Speech-to-Text (ASR/STT) cho tiếng Việt và đa ngôn ngữ.
- Tối ưu hóa mô hình về độ chính xác (WER/LER), tốc độ inference, và hiệu suất sử dụng tài nguyên.
- Thiết kế và duy trì pipeline STT độ trễ thấp cho ứng dụng real-time.
- Phát triển tính năng streaming transcription cho live audio inputs.
- Tối ưu hiệu suất GPU/CPU và memory footprint khi triển khai.
- Triển khai speaker diarization và multi-speaker identification.
- Xây dựng và duy trì data pipeline cho training và evaluation STT models.
- Tích hợp STT capabilities vào sản phẩm (Chatbot, Meeting Intelligence,…).
- Phối hợp với AI Team, LLM Team và Operations để triển khai production.
1. Kinh nghiệm chuyên môn.
- Có 6 tháng – 2 năm kinh nghiệm Speech/Audio ML.
- Kỹ năng Python và deep learning framework mạnh (PyTorch, Nemo, Huggingface).
- Hiểu và làm việc tốt với các mô hình ASR phổ biến (Whisper, Wav2Vec2, Conformer),
bao gồm fine-tuning và tối ưu theo từng bài toán. - Có kinh nghiệm xử lý audio (preprocessing, feature extraction, data augmentation) và đánh giá chất lượng (WER/CER, SNR,…).
- Hiểu về hệ thống real-time/streaming (VAD, latency optimization, streaming APIs) và tích hợp STT vào sản phẩm.
- Có kinh nghiệm phát triển API (FastAPI, gRPC) và làm việc với các công cụ tracking (MLflow, W&B, TensorBoard).
2. Kỹ năng cần có.
- Có tinh thần trách nhiệm cao với công việc, thái độ làm việc tích cực.
- Có khả năng làm việc theo đội, nhóm.
- Kỹ năng giao tiếp và giải quyết vấn đề.
- Có khả năng đọc hiểu và ứng dụng các tài liệu nghiên cứu chuyên ngành.
3. Là lợi thế nếu có.
- Kinh nghiệm làm việc với các kiến trúc ASR end-to-end (Transformer, Conformer, Whisper).
- Kinh nghiệm speaker diarization và nhận diện đa người nói.
- Kinh nghiệm xử lý âm thanh real-time và streaming inference.
- Đã từng triển khai ASR cho tiếng Việt hoặc các ngôn ngữ ít tài nguyên.
- Kinh nghiệm về data augmentation và domain adaptation cho STT.
- Kinh nghiệm tối ưu mô hình (quantization, tối ưu cho edge deployment).
- Hiểu biết về tiền xử lý và hậu xử lý audio (filtering, noise reduction, VAD, normalization).
- Kinh nghiệm tích hợp hoặc sử dụng các dịch vụ/API STT (cloud hoặc self-hosted).
- Mức lương cạnh tranh dựa trên năng lực.
- Được cung cấp đầy đủ trang thiết bị làm việc.
- Lương tháng 13, 12 ngày phép (cứ mỗi năm thâm niên sẽ có thêm 1 ngày phép). thưởng trong tất cả các ngày Lễ - Tết.
- Tham gia đầy BHXH, Công đoàn theo Luật quy định.
- Xem xét Review lương định kỳ năm theo năng lực.
- Tham gia team building, nhiều hoạt động, CLB cầu lông, bóng đá.
- Môi trường làm việc trẻ trung, năng động, và nhiều cơ hội thăng tiến trong công việc.
Benefits
- Mức lương cạnh tranh dựa trên năng lực.
- Được cung cấp đầy đủ trang thiết bị làm việc.
- Lương tháng 13, 12 ngày phép (cứ mỗi năm thâm niên sẽ có thêm 1 ngày phép). thưởng trong tất cả các ngày Lễ - Tết.
- Tham gia đầy BHXH, Công đoàn theo Luật quy định.
- Xem xét Review lương định kỳ năm theo năng lực.
- Tham gia team building, nhiều hoạt động, CLB cầu lông, bóng đá.
- Môi trường làm việc trẻ trung, năng động, và nhiều cơ hội thăng tiến trong công việc.