[G5]データを知らずにインフラを組むな 〜RNA-Seq × Fargate 死亡日記〜
Track G
〜
(15分)
一ノ瀬 美帆/井山 学
@jawsdaysRNA-Seq(遺伝子発現解析)の前処理パイプラインをAWS上に構築しています。 Step Functions + Batch(Fargate)で自動化し、ローカル検証も通った。あとは展開するだけ...のはずでした。 しかし検証環境でFargateが2回死にました。1回目はストレージ、2回目はメモリ。どちらも扱うデータの特性を理解していれば防げた問題でした。
本セッションでは、馴染みの薄いドメインのシステムを構築する際に陥りがちな落とし穴と、そこから得た教訓をお話しします。 なお、発表準備中にAWS HealthOmicsというゲノム専用サービスの存在を知りました。バイオの専門知識は不要です。