データサイエンティスト 音声、自然言語処理モデル構築

こちらの案件は現在募集を
停止しています。
単価/月
60~75万円
勤務地
東京都,文京区

案件概要

音声認識後のテキストまたは音声データに基づき、発話ごとに会話のドメインや意図を分類し、ラベルを付与するモデルを構築します。
初期スコープでは、金融の日本語コールセンターデータを対象とする予定です。

後続フェーズにおいては、より言語理解寄り、BIOラベルの付与などに進んでいく可能性が高いです。
音声認識部分には既存モデルが存在するため、ノイズを含んだ純粋なNLPプロジェクトとして進めることも可能ですが、
E2Eで構築した方が精度が高い場合は、音声認識~言語理解まで含めたモデル構成とすることも可能です。
完成したモデルをプロダクション化する場面では別のMLエンジニアが入りますので、前処理 /モデル構築/評価部分のみをご担当いただく想定です。

<作業環境>
Windows/Mac選択可

<開発環境>
環境・OS:AWS(Amazon Web Services), Linux

<開発工程>
・要件定義
・基本設計
・詳細設計
・実装・構築・単体試験

<備考>
基本リモート

<基本時間>
10:00~19:00

<服装>
オフィスカジュアル

期間

即日 ~ 2022/12/31

必須スキル・経験

・深層学習ベースの音声認識/NLPプロジェクトにおける開発経験
・BERTやWav2vecなどの自己教師あり学習+Fine-tuningからなるモデルアーキテクチャへの理解
・HuggingfaceやPytorchを利用した学習パイプラインの構築やモデルのチューニング経験

歓迎するスキル・経験

・音声対話システムの研究、開発経験
・クライアント向け説明、資料作成の経験
・AWS/Linux/Gitなど開発インフラに対する基礎知識

稼動日数

週5日

商談回数

1回

最寄駅

東京メトロ丸ノ内線 本郷三丁目駅

案件の詳細

即日参画OK / 商談1回 / 10時開始 / リモート / 原則リモート

リモート詳細

基本リモート

精算条件

140h-180h

支払サイト

月末締めの翌月末日払い
案件担当のおすすめポイント
データサイエンティストとして、音声・事前言語処理モデルの構築を支援して頂く案件です。基本リモートでご対応頂きます。