AWS Lambda pythonでGlueのクローラを実行する関数

Glueのスケジュールではなくて、S3の終了ファイルをトリガにクローラを実行したい場合のために作りました。

S3データをパーティションに分けている場合、クローラを実行してパーティションを読み込ます必要があります。

Lambda関数

S3イベントの設定

S3バケットのプロパティを選びます。

見逃しやすいですが、プロパティの下のほうにあるイベントを選びます。

イベントの「すべてのオブジェクト作成イベント」をチェックします。

送信先を「Lambda関数」にして

Lambdaに上で作った関数名を指定します。