Mantra株式会社 · Mantra 株式会社

Mantra株式会社 机械学习工程师

280k-480k/年  /  东京

昨天 17:06 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

  • 招聘类型:社招
  • 工作性质:全职

职位描述

年收入范围

600万日元~1000万日元


工作地点

东京都文京区后乐2丁目3番21号住友不动产饭田桥大楼2F


工作内容

概要

负责漫画等娱乐内容相关的翻译研究开发。主要任务是提升翻译精度和优化翻译工作流程。在漫画翻译中,不仅涉及文本机器翻译,还包括对漫画图像理解(OCR及角色识别)和图像编辑(文字擦除及风格生成)。因此,需要处理语言与图像多模态理解和生成相关各种课题。

当前主要面临的问题

- 机器翻译方面:

故事类作品如漫画的机器翻译不同于一般商务文档,仅传达意思不够,还需生成令人愉悦且流畅的台词文本。这要求“流畅性”,单纯使用现有LLM难以满足。此外,为提升精度必须能评估质量,但如何评价故事中的流畅性仍是未充分解决且复杂的问题。同时还存在考虑剧情上下文、人物关系、多模态信息融合以及文化本地化等独特挑战。

- 图像处理方面:

需处理的不仅是气泡内文字,还有背景音效文字(拟声词)、画中标牌文字等。这些字符识别困难,在进行翻译时必须擦除原文字并适当补充背景,同时生成符合原风格的新文本。目前扩散模型推动了图像生成技术发展,但仍存在色调复原不佳、漫画画风破坏等诸多难题。

部分研究课题示例

利用漫画对照数据训练开源LLM模型

利用历史修正记录改善翻译精度

娱乐领域机器翻译自动评估方法开发

基于多模态信息进行台词说话者推断(已被ACMMM2024会议采纳)

手写文字及拟声词识别技术开发

使用Stable Diffusion等扩散模型实现文字擦除与背景补全

文本风格估计及合理排版生成

基于对照数据训练实现自动排版


开发环境

编程语言 Python

框架 PyTorch, huggingface, OpenCV

基础设施 AWS, GCP, 内部GPU服务器(A6000×16台)

前端 Vue.js, Typescript

后端 Django, Python

源代码管理 GitHub

信息共享工具 Notion, Discord


工作形式及待遇

可从副业加入

有股票期权(SO)

面向BtoB和BtoC业务

全球化团队

平均加班时间低于20小时/月

需用英语书写与交流

弹性工作制(Flex)

高管中有工程师成员

有育儿休假取得实绩

初创企业氛围

任职条件

必要技能与经验

在自然语言处理或图像识别领域具备研发经验

拥有硕士或博士学位,或至少2年以上机器学习相关实务经验

能独立制定研究计划并发表同行评审论文或相当水平成果

有过机器学习模型训练及任务性能优化经验

熟悉英文论文调研能力

英语沟通能力达到能进行基本非日语母语者交流水平


优先条件

自然语言处理或图像处理专业知识丰富者优先

有使用大型语言模型、大扩散模型等前沿技术开发经验

在国际会议或期刊上作为第一作者发表过论文优先

拥有机械学习工程师实际工作经历

有管理推进ML PoC项目经验

有Web服务或应用程序开发经验


理想候选人特质

持续学习已成为习惯

善于假设思考并勇于验证假设

乐于与不同专业背景的人交流合作

能主动承担责任,自主推进开发工作

对Mantra业务领域(漫画、语言、机械学习)高度感兴趣