工作内容:1、承担在语音大模型等方向上技术的研究与开发。包括声音克隆、zero-shot语音合成、文生语音、语音翻译、ASR、音效生成等。2、承担背景音分离、降噪、说话人识别、VAD等语音基础技术的研发与工程化。3、负责相关算法在移动端、PC端、云端等场景的产品化落地。
职位要求:1、精通深度学习、大模型训练、音频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、CosyVoice、SenseVoice等模型和技术;
2、熟练掌握Python/C/C++语言,数据结构和算法基础扎实,了解CUDA开发和TensorRT;
3、熟练掌握Tensorflow、Caffe、pytorch等任一种深度学习框架。
广州市天河区黄埔大道西122号星辉中心
趣丸科技成立于2014年,是中国领先的国家高新技术企业,形成了集兴趣社交、人工智能、电子竞技等业务于一体的多元业务矩阵。公司专注人工智能交互前沿技术研究和提供企业级解决方案,坚持创新驱动,已构建全栈式AI交互技术产业生态,在数字人、智能视听、三维生成、AI音乐等领域均有落地应用。公司持续多年保持研发投入与研发强度双增长。截止2025年1月,公司研发人员占比超62%,在全球获得专利、软著等知识产权数超1700项。近五年(2020年-2024年),公司累计研发投入超19亿元。