公司简介
年收入范围
600万日元~1000万日元
工作地点
东京都文京区后乐2丁目3番21号住友不动产饭田桥大楼2F
工作内容
概要
负责漫画等娱乐内容相关的翻译研究开发。主要任务是提升翻译精度和优化翻译工作流程。在漫画翻译中,不仅涉及文本机器翻译,还包括对漫画图像理解(OCR及角色识别)和图像编辑(文字擦除及风格生成)。因此,需要处理语言与图像多模态理解和生成相关各种课题。
当前主要面临的问题
- 机器翻译方面:
故事类作品如漫画的机器翻译不同于一般商务文档,仅传达意思不够,还需生成令人愉悦且流畅的台词文本。这要求“流畅性”,单纯使用现有LLM难以满足。此外,为提升精度必须能评估质量,但如何评价故事中的流畅性仍是未充分解决且复杂的问题。同时还存在考虑剧情上下文、人物关系、多模态信息融合以及文化本地化等独特挑战。
- 图像处理方面:
需处理的不仅是气泡内文字,还有背景音效文字(拟声词)、画中标牌文字等。这些字符识别困难,在进行翻译时必须擦除原文字并适当补充背景,同时生成符合原风格的新文本。目前扩散模型推动了图像生成技术发展,但仍存在色调复原不佳、漫画画风破坏等诸多难题。
部分研究课题示例
利用漫画对照数据训练开源LLM模型
利用历史修正记录改善翻译精度
娱乐领域机器翻译自动评估方法开发
基于多模态信息进行台词说话者推断(已被ACMMM2024会议采纳)
手写文字及拟声词识别技术开发
使用Stable Diffusion等扩散模型实现文字擦除与背景补全
文本风格估计及合理排版生成
基于对照数据训练实现自动排版
开发环境
编程语言 Python
框架 PyTorch, huggingface, OpenCV
基础设施 AWS, GCP, 内部GPU服务器(A6000×16台)
前端 Vue.js, Typescript
后端 Django, Python
源代码管理 GitHub
信息共享工具 Notion, Discord
工作形式及待遇
可从副业加入
有股票期权(SO)
面向BtoB和BtoC业务
全球化团队
平均加班时间低于20小时/月
需用英语书写与交流
弹性工作制(Flex)
高管中有工程师成员
有育儿休假取得实绩
初创企业氛围
必要技能与经验
在自然语言处理或图像识别领域具备研发经验
拥有硕士或博士学位,或至少2年以上机器学习相关实务经验
能独立制定研究计划并发表同行评审论文或相当水平成果
有过机器学习模型训练及任务性能优化经验
熟悉英文论文调研能力
英语沟通能力达到能进行基本非日语母语者交流水平
优先条件
自然语言处理或图像处理专业知识丰富者优先
有使用大型语言模型、大扩散模型等前沿技术开发经验
在国际会议或期刊上作为第一作者发表过论文优先
拥有机械学习工程师实际工作经历
有管理推进ML PoC项目经验
有Web服务或应用程序开发经验
理想候选人特质
持续学习已成为习惯
善于假设思考并勇于验证假设
乐于与不同专业背景的人交流合作
能主动承担责任,自主推进开发工作
对Mantra业务领域(漫画、语言、机械学习)高度感兴趣