データサイエンティスト音声、自然言語処理モデル構築

こちらの案件は現在募集を
停止しています。

原則リモート

単価/月: 60～75万円

勤務地: 東京都,文京区

案件概要

音声認識後のテキストまたは音声データに基づき、発話ごとに会話のドメインや意図を分類し、ラベルを付与するモデルを構築します。
初期スコープでは、金融の日本語コールセンターデータを対象とする予定です。

後続フェーズにおいては、より言語理解寄り、BIOラベルの付与などに進んでいく可能性が高いです。
音声認識部分には既存モデルが存在するため、ノイズを含んだ純粋なNLPプロジェクトとして進めることも可能ですが、
E2Eで構築した方が精度が高い場合は、音声認識～言語理解まで含めたモデル構成とすることも可能です。
完成したモデルをプロダクション化する場面では別のMLエンジニアが入りますので、前処理 /モデル構築/評価部分のみをご担当いただく想定です。

＜作業環境＞
Windows/Mac選択可

＜開発環境＞
環境・OS：AWS(Amazon Web Services),　Linux

＜開発工程＞
・要件定義
・基本設計
・詳細設計
・実装・構築・単体試験

＜備考＞
基本リモート

＜基本時間＞
10：00～19：00

＜服装＞
オフィスカジュアル

期間

即日～ 2022/12/31

言語

データ領域上流 Linux(RHEL) Linux(CentOS) AWS

必須スキル・経験

・深層学習ベースの音声認識/NLPプロジェクトにおける開発経験
・BERTやWav2vecなどの自己教師あり学習＋Fine-tuningからなるモデルアーキテクチャへの理解
・HuggingfaceやPytorchを利用した学習パイプラインの構築やモデルのチューニング経験

歓迎するスキル・経験

・音声対話システムの研究、開発経験
・クライアント向け説明、資料作成の経験
・AWS/Linux/Gitなど開発インフラに対する基礎知識

稼動日数

週5日

商談回数

1回

最寄駅

東京メトロ丸ノ内線　本郷三丁目駅

案件の詳細

即日参画OK / 商談1回 / 10時開始 / リモート / 原則リモート

リモート詳細

基本リモート

精算条件

140h-180h

支払サイト

月末締めの翌月末日払い

案件担当のおすすめポイント

データサイエンティストとして、音声・事前言語処理モデルの構築を支援して頂く案件です。基本リモートでご対応頂きます。

データサイエンティスト 音声、自然言語処理モデル構築