CloudWatch Eventsを使ってECSタスクを監視するツールをSAMで作る

こんにちは、SREエンジニアのたっち(@TatchNicolas)です。これまではPythonによるサーバサイド開発を担当していましたが、SREエンジニアとしてプロダクトを横断して安定性・パフォーマンス改善に取り組む担当になりました。

ヘルスチェックしにくいバッチ系のECSタスク

JX通信社では、ワークロードのほとんどをAWS LambdaまたはECSの上で動かしています。 Webサービス自体やAPIなどはALBやECSサービスのヘルスチェックを使って異常を検知したり、StatusCakeのようなサービスを使って外形監視をすることができます。

しかし、エンドポイントを持たないバッチ処理のようなタスクは、タスク自体が起動に失敗したり、途中で失敗した場合に上記の方法では検知することができません。

そこで、AWSの強力な機能の一つであるCloudWatch Eventsを使って、うまく動作しなかったECSタスクがあった場合にSlackへ通知できる仕組みをつくってみました。

CloudWatch Eventsとは

CloudWatch Eventsを使うと、イベントパターンを定義することでAWSリソースの変更をリアルタイムに取得してAWSのアクションをトリガーすることができます。 AWSリソースの変更だけでなく、スケジュールを組んで処理の自動化をすることも出来ます。 定期的に行いたいちょっとした処理をLambdaで書いてCloudWatch Eventsのcronで呼ぶ、みたいなことは実践していらっしゃる方も多いかと思います。

今回はイベントパターンを使ってECSタスクの状態変化を検知し、LambdaでSlackにアラートを投げてみたいと思います。

どうせやるならSAMで

監視のツール自体が秘伝のタレになってしまったり、依存しているAWSリソースがわからなくなってしまっては健全ではありません。

Lambdaの管理ツールはApex(記事執筆時点でメンテナンスがすでに終了)、Serverless Frameworkなど色々ありますが、今回はCloudWatch Eventsのイベントパターンもまとめて定義してしまいたいので、CloudFormationと親和性の高いSAMを採用します。

構成とコード

簡単な構成図とコードは以下のとおりです。

f:id:TatchNicolas:20190815142005p:plain
構成図

app/main.py

import json
import os

import requests

SLACK_WEBHOOK = os.environ['SLACK_WEBHOOK']
AWS_REGION = os.environ['AWS_REGION']


def lambda_handler(event, context):

    if event.get('source') != 'aws.ecs':
        print('Invalid event')
        print(event)
        return

    detail = event['detail']
    header = 'ECSタスクが異常終了または起動に失敗しました\n'

    cluster_name = detail['clusterArn'].split('/')[1]
    task_id = detail['taskArn'].split('/')[1]
    task_def = detail['taskDefinitionArn'].split('/')[1]

    url = f'https://{AWS_REGION}.console.aws.amazon.com/ecs/home?region={AWS_REGION}#/clusters/'\
        f'{cluster_name}/tasks/{task_id}/details'

    text = '\n'.join([
        header,
        f'クラスタ: *{cluster_name}*',
        f'タスク定義: *{task_def}*',
        url,
        '```',
        json.dumps(detail, indent=2),
        '```',
    ])
    attachments = {
        'text': text,
        'color': 'danger'
    }

    payload = {
        'attachments': [attachments]
    }
    requests.post(SLACK_WEBHOOK, json=payload)

template.yaml

AWSTemplateFormatVersion: '2010-09-09'
Transform: AWS::Serverless-2016-10-31
Description: >
  sam_python37

  Sample SAM Template for Python 3.7

Globals:
  Function:
    Timeout: 3

Resources:
  ECSMonitor:
    Type: AWS::Serverless::Function
    Properties:
      CodeUri: app/
      Handler: main.lambda_handler
      Runtime: python3.7
      Environment:
        Variables:
          SLACK_WEBHOOK: https://hooks.slack.com/services/xxxxxxxx/xxxxxxxx/xxxxxxxxxxxxxxxxxxxxxxx
      Events:
        CommandNotFound:
          Type: CloudWatchEvent
          Properties:
            Pattern:
              !Sub |
              {
                "detail-type": [
                  "ECS Task State Change"
                ],
                "source": [
                  "aws.ecs"
                ],
                "detail": {
                  "clusterArn": [
                    "arn:aws:ecs:ap-northeast-1:123456789012:cluster/cluster-to-monitor-a",
                    "arn:aws:ecs:ap-northeast-1:123456789012:cluster/cluster-to-monitor-b"
                  ],
                  "containers": {
                    "exitCode": [
                      1,
                      127
                    ]
                  }
                }
              }
        TaskFailedToStart:
          Type: CloudWatchEvent
          Properties:
            Pattern:
              !Sub |
                {
                  "source": [
                    "aws.ecs"
                  ],
                  "detail-type": [
                    "ECS Task State Change"
                  ],
                  "detail": {
                    "clusterArn": [
                        "arn:aws:ecs:ap-northeast-1:123456789012:cluster/cluster-to-monitor-a",
                        "arn:aws:ecs:ap-northeast-1:123456789012:cluster/cluster-to-monitor-b"
                    ],
                    "stopCode": [
                      "TaskFailedToStart"
                    ]
                  }
                }

template.yaml のほうも、リージョン名やAWSアカウントの部分も疑似パラメータにできそうですが 面倒くさかった わかりやすさを優先してハードコードしちゃってます。

実装していてハマったのは、CloudFormationでイベントパターンを定義しているところです。

最近はCloudFormationをJSONで書くケースは稀かもしれませんが、イベントパターンはYAMLで書いた場合に意図せぬ挙動をすることがあります。

YAMLではクオートをつけない文字列は数値として扱われるのが基本ですが、コンテナの終了コードをイベントパターンに定義する場合、デプロイした際に数値型が文字列型に変換されてしまいます。

つまり、以下のようなイベントパターン定義がCloudFormation中にあっても、

# (略)
EventPattern:
  source:
  - aws.ecs
  detail-type:
  - ECS Task State Change
  detail:
    clusterArn:
    - arn:aws:ecs:ap-northeast-1:123456789012:cluster/samplestack
    containers:
      exitCode:
      # クォートで囲っていないので数値として扱われることを期待
      - 1
      - 127
# (略)

このようなJSONとして、exitCode の値が数値型でなく文字列型としてCloudWatch Eventsに設定されてしまいます。

{
  "detail-type": [
    "ECS Task State Change"
  ],
  "source": [
    "aws.ecs"
  ],
  "detail": {
    "clusterArn": [
      "arn:aws:ecs:ap-northeast-1:123456789012:cluster/samplestack"
    ],
    "containers": {
      "exitCode": [
        "1",
        "127"
      ]
    }
  }
}

すると、CloudWatchが発行するイベントJSONではexitCodeは数値型で渡されるので、イベントパターン定義と比較されるときに 127"127"イコールにはならず、イベント発火の条件にマッチしない結果になってしまいます。 しかし、テンプレート自体をJSONで書くのもツラいので、前述のサンプルの通りイベントパターンの部分のみをJSONで書くようにして回避できました。

また、記事執筆時点でワイルドカードや否定の条件には対応していないようでした。 そのため、「終了コードが0以外」のような条件を指定するのはやや難しいようです。

上記の例ではCloudWatch側でコンテナの終了コードを条件として指定し、Lambdaの発火をコントロールしました。 コストを受け入れられるのであればイベントパターンの条件をクラスタARNのみにして、Lambda側でイベントで送られてくるJSONの内容を元にSlack通知するかどうかを判断させるパターンでも良いかもしれません。

まとめ

今回はすでに利用中のタスク定義に手を加えずにタスクの成功/失敗を取得するような簡単な監視の仕組みを作ってみました。

次回は、サイドカーコンテナを使って(=タスク定義に手を加えて)より詳細な監視ができる仕組みを作ってみようと思います。

参考資料

  • Amazon CloudWatch Events イベントパターン
  • AWS CLI test-event-pattern
    • イベントのJSONとイベントパターンのJSONを入力として、マッチするかどうかをチェックできます。
    • 実施にイベントを起こしてAWS上で検証すると時間もお金もかかってしまうので、取りたいイベントのJSONを保存しておいて手元で検証するのが良いでしょう。

PostgreSQL 版 Aurora Serverless を開発環境で使ってみた

こんにちは、Pythonエンジニアの @kimihiro_n です。 今回はこの前リリースされた PostgreSQLの AWS Aurora Serverless を使ってみたという話を。

TL;DR

  • Auroraと比較してだいぶ安い
  • オートスケール便利
  • 立ち上げは結構遅い
    • 開発環境用途には便利
    • 本番はキャパシティを0にしない工夫が必要

Aurora Serverless とは

f:id:nsmr_jx:20190722203232p:plain:w300

MySQL、PostgreSQL と互換性がある AWS 製のリレーショナルデータベースとして Amazon Aurora というサービスがあります。 通常の MySQL などとと比べて高いパフォーマンスが出るよう独自にチューニングされており、マネージドサービスとしてインスタンスをあまり意識せず利用することができます。 またデータベースのサイズが自動で拡張する ( 64TB まで) ので、ディスク容量を心配せず利用できるのも大きな特徴ですね。

AuroraServerless はこの Aurora をさらに進化させたタイプのデータベースです。 Aurora の場合、マネージドサービスとはいえ起動しておくインスタンスのスペックや個数は自分で管理する必要があります。 利用負荷に応じてインスタンス数が自動で増減するわけではないので、使う量に応じてインスタンスを手動調整したり、オートスケールを設定したりする必要があります。 また Reader、Writer の概念があるため Writer の負荷に注意するなどといったことも大切です。

AuroraServerless では処理能力がキャパシティという単位で抽象化されており、キャパシティ数を変更することで柔軟にスケーリングすることが可能です。 デフォルトでオートスケールが組み込まれており、最低キャパシティと最大キャパシティ、それから利用がないときはキャパシティを0にするかどうかだけを設定すれば利用することが可能です。

この前まで MySQL 版でしか AuroraServerless に対応していなかったのですが、先日 PostgreSQL の Serverless も一般公開され自由に使えるようになりました!

https://aws.amazon.com/jp/rds/aurora/serverless/

PostgreSQL 版 Serverless を使ってみる

現在、開発環境と本番環境で PostgreSQL 版の Aurora データベースを利用しているのですが、Serverless 版が出たので早速使ってみることにしました。 使ってみたかったという動機はもちろんありますが、 Serverless を利用する大きな理由がコストですね。

Aurora データベース、インスタンスの値段が結構高く、開発環境で使うにはコストが嵩んでいました。 特に PostgreSQL 版だと MySQL 版より最低限必要なインスタンスのスペックが大きくつらみがありました。 これを Serverless 版に変更することで、最低ラインの費用を下げたり、利用されない深夜帯・休日の間のコストを0にしたりといったことが可能になります。

  • Aurora

    0.35($/instance/hour) * 1(instance) * 24(hour/day) * 30(day/month) = 252 ($/month)

  • Aurora Serverless

    0.1($/cap/hour) * 2(cap) * 24(hour/day) * 30(day/month) = 144 ($/month)

最低限の状態で24時間・30日動かした場合の費用比較です。どちらも東京リージョンで、Auroraは r5.large の1台構成での費用です。 PostgreSQL を Serverless で動かす場合最低 2 キャパシティとなっていました。 (MySQL 版は 1 キャパシティから)

ずっと動かす前提でも半額くらいになるみたいです。月100ドルの差は結構大きいですね。 開発環境の場合使わない時間帯のほうが大きいのでここから更に安くなりそうです。

Aurora からの移行

移行作業自体はスムーズでした。

  1. Aurora のデータベースを pg_dump コマンドでバックアップする
  2. 新しく Serverless でデータベースを起動させる
  3. ダンプしたデータを流し込む
  4. データベースの接続先をつなぎ替える

で完了しました。

同じ Aurora ファミリーだから RDS のスナップショットから Serverless 版起動できるかなと思ったのですが、バージョン違いからか Serverless の選択肢がグレーアウトしており、手動でデータを流し込む必要がありました。

特記すべきは Serverless 版には Reader・Writer の区別がないことですね。 アプリケーション側で使い分けの処理入れてましたが、区別ないので同じエンドポイントを両方に指定してます。

動作検証

移行できたようなので動作確認へ。 Django のアプリケーションで利用していて、一通りの機能を試してみましたが問題なさそうでした。 PostGIS のような拡張機能もちゃんと動いています(すんなり動いてしまって逆に怖さがあります)。

未利用時の挙動

一番気になるのが未利用時の挙動ですね。 DBへのリクエストがしばらくない場合、キャパシティを0にすることができます。 この状態であればストレージに対する課金のみでデータベースを維持する事ができます。

f:id:nsmr_jx:20190722192135p:plain

アプリケーションサーバーにアクセスしないで放置した状態でのキャパシティの変化。 2キャパシティで動いていたのが自動で0キャパシティに変化してますね。問題なさそうです。

逆にこの状態でアプリケーションサーバーにアクセスするとどうなるでしょうか。 キャパシティが0、つまりDBサーバーが停止している状態でアクセスするので、DB接続エラーになってしまわないかが心配です。

f:id:nsmr_jx:20190722192153p:plain

DBへのリクエストによってキャパシティがもとに戻る図。 接続エラーが出ることなくキャパシティが無事に戻りました。 ただやはりキャパシティが0から立ち上がるには少し時間がかかります。 状況にもよりますが10~30秒ほどかかっている気がします。 実際のユーザーがいる環境ではあまり起こってほしくない待ち時間ですね。

キャパシティ0でないときのレスポンスは概ね良好でした。ただ時々詰まったような挙動をすることがあります。 (アプリケーションサーバーを経由しての挙動確認なので、発行するクエリが一時的に多くて、用意していたキャパシティに対する処理が不足していたとかかもしれません。※ 要調査)

f:id:nsmr_jx:20190722192215p:plain

Serverless 切り替え前と後の平均レスポンスの変化。

グラフが跳ね始めてるのがちょうど切り替えのタイミングです。 開発環境なのでリクエスト総数がそんなになく、1つ遅い応答時間があると平均も跳ねてしまうという点は留意して見る必要があります。 キャパシティが0になってしまうと待ち時間が多く発生してしまうので、本番環境で Serverless を導入する際はどうキャパシティを制御するかが鍵になりそうですね。 開発環境用であれば多少待つくらいで済むので問題なさそうです。

おわりに

Serverless のおかげでデータベースを安く楽に管理できるのはありがたいですね。 待ち時間を気にしなくてよく、常日頃可動しているわけではないバッチ処理系とも相性が良さそうです。 サーバレスなデータベースの選択肢の一つとして活用してみてはどうでしょうか。

Flutterでモブプログラミング会を(12人で)やってみました

JX通信社のアプリエンジニアのぬまっち(@numatch2552)です。普段はAndroidエンジニアをやっています。 そして1年ほど前に技術書ビブリオバトルの記事を書いた者です。

早いものであの記事から1年が経ちました。今回も自分が担当する社内勉強会ではちょっと変わった趣向で開催してみました!

高まるFlutterの機運

昨年末に安定版がリリースされたFlutterですが、社内でも機運が高まっていました! さらにアプリエンジニアとして、業務で使う事もあって自分として知見もあったので 勉強会のメインに選定しようと思いました。

しかし新しいプラットフォームでの勉強会って、参加者の環境構築で躓くことが多いですよね。 かくいう自分も経験があります。 最初はFlutterのハッカソンを考えていましたが、Flutter未体験の参加者が多い状態なので頭を悩ませました。

モブプログラミングでやってみよう

そこで思いついたのは、モブプログラミングと掛け合わせることでした。 モブプログラミングとは下記の記事を参考にさせて頂きました。↓↓↓
まだ1人でコード書いてるの?モブプロを1日中、3週間毎日続けて得た知見 | Kurashicom Engineers' Blog

第一に勉強会なので、業務のようにスピード優先というものはありませんし、 知見の共有という点ではモブプロが最適に思えました。 モブプロも初めての実践でしたが、「やればきっと出来る!」くらいの勢いで挑みました(笑)

どこまでを目指すのか

社内勉強会は2時間なので、その範囲でどこまで作るのかを事前に考えようと思いました。 しかもモブプロ未経験者が集まって進めるので、スピードは上がらないことが予想されます。

その上で Flutterってこういう作りなんだ! という体験はしてもらいたかったので、 下記の仕様を考えました。

  • 全部で2画面
  • 最初の画面(main.dart)
    • 画面中央にテキスト・ボタンがある
    • ボタンの押下で2番目の画面に遷移する
  • 2番目の画面(second_page.dart)
    • FloatingActionButtonがある
    • FABが押下されるとリストが描画される
    • FABが押下される度にリストの項目が増えていく

当日イメージしやすいように、事前にこちらで簡単なアプリを作成しておきました。 モブプロに入る前に参加者に見て貰うことで、どこまでをゴールにするかが明確に伝わったかなと思います。

勉強会当日

12人によるモブプログラミング

当日、勉強会を開催する時間になると参加者が集まってきました。 その数12人!(事前に把握しておけよ、と)

経験者を除くと10人が未経験者でした。 これでモブプログラミングが成り立つのかと正直焦りましたが、もうやり遂げるしかありません。

キーボード問題

始めようとしてすぐに問題が発覚です。 キーボードには USキーボードとJISキーボードがあるのです。

JX通信社では好きな方のキーボードを選ぶ事ができます。(ちなみに自分の業務用MacBookはUSキーボードです。) 自分のMacBookをみんなで回していけばモブプログラミング出来るだろう、と考えていましたがJIS派のエンジニアもいるので、頭を抱えました。

ここでメンバから「複数のワイヤレスキーボードを接続すればいける」と助言を頂いて助かりました。 初っ端から躓きましたが、社内から両方のキーボードを揃えてきてスタートです。

最初の画面を作る

基本的に経験者はノータッチですが、本当に詰まった時は助言する形で進めました。

「Widgetって何だろう」 「とりあえずMaterialAppってのを使うといいみたい!」

main関数から最初を画面を呼び出しところから始まり、ツールバーを表示する方法などをみんなで調べながら進めていました。

f:id:numatch-jx:20190711212724p:plain
勉強会風景

みんなDart言語も初めてなので、コンパイルエラーの解決方法も一苦労です。

「ここでreturnが必要なのはなのは何でだろう?」 「何かが足りないってエラー出てますね。セミコロンかも。」

(言語の好みの話題も出てきて、個人的に興味深かったです。)

ドライバーを5分交代で次々と変えていきながら、ナビゲーターがサポートする形で進めていきました。

やがてStatelessWidgetScaffoldWidgetを使って最初の画面が形作られます。

ButtonWidgetの実装で詰まった時の事が印象的でした。 一口にButtonのWidgetといってもFlatButtonIconButtonなど種類がありますが、 みんなで意見を出し合って仕様を満たすRaisedButtonが選ばれました。

押下後の動作についての実装もWebメインの方だとイメージが湧きにくかったようですが、 経験者がアロー関数で実装する方法を紹介して最初の画面が完成します。

二番目の画面の実装

次の画面では FloatingActionButtonが押される度に画面に表示されるリストの内容が更新される という目標があります。 ここでは Flutterの要素でも重要な StatefulWidget を使う必要が出てきます。

だんだん参加者の方たちも、最初の画面よりは慣れてきたのか進みが早くなってきましたが、 FloatingActionButtonの実装や、表示するList内容の定義まではすんなり迷う事なく進んでいたと思います。

Button押下時の実装方法は前の画面で分かってきましたが、中々画面の表示を更新させる方法が分からずにドライバーが交代していきました。

経験者が助言しなければ厳しいのではないか、とも思っていました。 ですが、9人のナビゲーターが調べていく中で助言なしに StatefulWidgetsetState()を組み合わせることでbuildが再度コールされる事に辿り着きました。

f:id:numatch-jx:20190708213527j:plain
勉強会風景2

画面表示が更新された時、自然と歓声が湧き上がったのがとても印象的でした。 ナビゲーターが知見を共有しあって実装の解を見つけ、みんなで進捗を祝う。まさにモブプログラミングの醍醐味を味わえた瞬間だったと思います。

そして、2時間という決まった枠組みの中で目標としていた仕様を満たしたアプリが出来上がりました。

f:id:numatch-jx:20190708213044g:plain
完成したFlutterアプリ

開催してみて

正直始まるまでは上手く進行できるのか、決められた枠組みの中で目標としたアプリが出来るのか、不安でいっぱいでした。

サーバーサイドエンジニアやフロントエンジニアなど、普段ネイティブアプリ開発とは離れた業務をされてる方も沢山参加頂きましたが、 抜群のチーム開発力を発揮して、みんなでモブプログラミングを進めることが出来て嬉しかったです。

終わってみればJXエンジニアのメンバがFlutterに対して興味津々であったことに、非常に助けられたと思います。

FlutterのWidgetを元とした構成のおかげで、複数のファイルを行き来することなく一つのファイルで画面を構成することが出来ることも モブプログラミングとの相性が良いのではないか?と感じる事も出来ました。

改めてFlutterの可能性も再発見出来たので、嬉しく感じる勉強会になったと思います。

メルカリの「1on1 Workshop」で1on1の極意を学んできた

JX通信社で VPoE をしている小笠原(@yamitzky)です。今回は、メルカリ社で開催された「1on1 Workshop」の公開講座にお邪魔してきたので、そのレポートです。

JX通信社では、VPoE のお仕事として、エンジニア中心に定期的な 1on1 (一対一の面談)をしています。

僕の 1on1 のスタイルとしては、

  • 隔週30分、会社の会議室(個室)で
  • 基本的にはアジェンダなしで、「最近どう?」「何か困ってる?」みたいなことから聞く
  • 1on1後に、議事録をSlackで送る
  • それ以外は特別なツールは使わない
  • 「悩み相談」と「やっていいこと」を共有するのがメイン

といった感じです。「聞きたいことリスト」みたいな形で持ってきてくれる人や、キャリア相談をする人、技術相談をする人、恋バナをする人もいますが、基本的には同じやり方でしています。

応募した背景と 1on1 の悩み

僕の場合は 1on1 にありがちな「進捗報告の場になってしまう」みたいな問題は起きていなかったのですが、社内の他のマネージャーともやり方が異なり、「僕の1on1はこれでいいのだろうか・・・🤔」という漠然とした悩みを持っていました。

そのような課題感がある中で、メルカリの石黒さんの note で「1on1 Workshop公開講座をやります!」とのことで、さっそく応募しました!

note.mu

応募フォームで事前に送った「質問」としては、

  • やり方がマネージャーごとに異なるが、会社全体でどう均質化していけばよいか?
  • マネージャーが答えっぽいものを言うのではなく、メンバー自身が解決できるようにするためにはどうしたらいいか?
  • メンバーの悩みを聞き出せなかった失敗経験があるが、引き出すためのテクニックはあるか?

といったところです。当日、Q&Aみたいな形で「明確な回答」をいただいたわけではないのですが、Workshopとおすすめいただいた本で9割5分くらい解決できた感じがします・・・!

当日

f:id:yamitzky:20190628172039j:plain
導入は石黒さん、本編は池田さんからの講義でした!

当日はメルカリ社のイベントスペース(会議スペース)での開催で、2時間半ほどのプログラムでした。

Workshop のプログラムとしては、スライドを使った講義だけでなく、当日参加した他企業の方とのディスカッションなどもあり、相対化しながら知ることができたので面白かったです。

f:id:yamitzky:20190628172332p:plain
こんな感じのディスカッションタイムがあります

各社で違う 1on1

JX 社内でも 1on1 のやり方が違うように、当日参加した各社でも形式は異なっていました。

たとえば、

  • 開催頻度
    • 毎週1時間開催する
    • 逆に、入社後は毎週やるけど、それ以降はやらない、とか
  • アジェンダ
    • 決めてる会社が多かった
    • たとえば「YWT」形式などで、学びや振り返りを重視する
    • Google Driveにアジェンダを書いておいたり
  • 場所
    • 社外でスマホ片手に、とか
    • 「会議室とか固いところだと話せない!」という人も
  • ツール

など、すごくバラバラです。メルカリ社内でも 1on1 の形式はマネージャーに任されており(やらないマネージャーもいる)、1on1 Workshop は「守破離の守」を伝えるためのもの、ということです。

1on1と「レベル」

おすすめされていた書籍「シリコンバレー流 最強の育て方」より紹介されていたのが「1on1 のレベル」です。

f:id:yamitzky:20190628172524p:plain

自分の 1on1 を振り返ってみると、人によっては「レベル1」ができてないことも「レベル5」くらいまでできてそうなこともあり、この時点で「全員同じではダメじゃん」と気づきました。

1on1 で大切なこと

1on1 で大切なことは、メタに言えば「どういう意図でやるか」ということだと思います。

f:id:yamitzky:20190628172605p:plain
これもディスカッションタイムの議題にありました

僕がVPoEとして 1on1 で実現したいことは「メンバーが目標達成に向かっていけるように、障壁を取り除く」ということです。 これは僕自身が権限を持って解決することも1つではあるのですが、「やっていいですよ」と権限に気づかせたり、あるいはエンジニアリングの観点で必要なヒントを与えるといったことも含みます。

メンバーが 1on1 という機会を活用するには、このあたりの意図を十分に伝える必要がありそうだなと思いました。

1on1、むずい...

f:id:yamitzky:20190628172832p:plain

Workshop の中で一番「むずそう...」と思ったのが、「メンバーの人となりをどれくらい知っているか」です。趣味や休日は知ってる人も多いのですが、性格については深く知らない人も多いです。全員が全員、そこまで踏み込むのが正解ではないと思いますが、特に悩みが深い人に関してはそこから深掘りをした方が良いかな、と思って少しずつ実践したりしています。

Tryすること

今回の Workshop を通じて、自分なりに考えてみた「Try」は

  • 1on1の意図を伝える
  • 1on1のやり方を一人ひとりに最適化する

です。改善をして、1on1 を通じた「エンジニアの成果と成長」に向き合っていきたいと思える会でした。石黒さん(@takaya_i)、池田さん(@sakicchoo)、ありがとうございました!

他の方の参加レポ

他社のレポも面白かったので合わせてご覧ください。

報道を自動化するエンジニアはゲーム自動化の夢を見るか

Pythonエンジニアの @kimihiro_n です。 今回は先日行った社内勉強会の話を。

社内勉強会

弊社では月1回、社内の開発者で勉強会を行っています。 内容はLT大会だったり、もくもく会だったり、ハンズオンだったりと幹事の人が好きにテーマを設定して実施しています。 おすすめの本を持ち寄ってビブリオバトル をやった時もありました。

今回、久しぶりに自分の担当が回ってきたわけですが、「AI同士の対戦」みたいなのやってみたいなーと前から思ってました。 AIというと大げさですが、各自プログラムしたゲームのCOM(CPUともいう)を持ち寄って、誰が一番強いのかを決めるみたいな内容です。 ニュースや報道の自動化を進めている弊社のエンジニアだったらゲームの自動操縦だってお手の物のはず…!

COM VS COM で一番強いチームを決める

実際にどうやってプログラム同士を戦わせるかですが、頭に浮かんだのは昔あった「カルネージハート」というゲームです。 アルゴリズムを組み込んだロボット同士を3on3で戦わせて遊ぶゲームなのですが、これがよく出来ていて一時期PSP版にハマっていました。 コーディングはテキストではなくてGUIのパネルみたいなのを並べて作るのですが、条件分岐やループ、関数的な別モジュールの利用といったようにかなり高度なことまで実装できます。 なのでカルネージハートとPSPを人数分用意して…と言いたいところですが、無理だったので代替案を考えることにしました。

ゲームを作る

Web 上でそういったプログラム同士の対戦をするサイト、どこかで見かけた覚えがあったので当初それを掘り起こして使おうと思ってました。 しかしサイト自体が閉鎖してしまったのか検索が甘かったのか、望みのものが見つかりませんでした…。 こうなったら自作するしか…ということで1人ハッカソンを始めました。

作りたいゲーム

  • 操作が単純である
  • ルールも単純である
  • 言語に不慣れなエンジニアでも楽しめる
  • 運要素が少ない(頑張ればその分勝ちやすい)
  • 2人1チームでも協力できる

ぱっと浮かんだ要件は上記のような感じでした。 勉強会の枠は2時間なので、その中で準備・実装・試合をこなすにはそれなりにシンプルであることが重要です。 また開発者といっても「サーバーサイドエンジニア」「アプリエンジニア」、「MLエンジニア」のように専門がそれぞれ異なります。 普段その言語を書いているエンジニアが強くて、他のエンジニアは動かすので精一杯みたいなのだと面白みにかけてしまいます。 なので基本文法を抑えていれば楽しめるようなゲームが望ましいです。 あとはプログラムを改善した分だけ強くなれる性質があったらなー、とか2人で分担や相談できたらなーみたいなことを漠然と思っていました。

Pong ゲーム

f:id:nsmr_jx:20190322171713p:plain
Pong

いろいろ考えた末思い浮かんだのが Pong ゲームでした。 操作が上か下かの2択でシンプル。ルールもボールを跳ね返して相手のゴールに入れるだけで単純です。 また、複数バーを用意することでチームっぽさも出すことができます。 ボールの動きが単純なので最終的な移動地点を予測してしまえば終わってしまう欠点はあるのですが、勉強会の短い時間であればちょうどいい難易度かなというのもポイントです。

Pyxel で作る Pong ゲーム

作るものが決まったので早速実装です。 当初みんな馴染みが多いだろうと Javascript で実装する気満々だったのですが、事前アンケートを取ってみたら Python のほうが慣れてる人多くて Python で作ることにしました。

github.com

ちょうど Python で使ってみたかった Pyxel(ピクセル) というゲームエンジンがあったのでこれ幸いと利用してみることに。

サンプルにあるように

import pyxel

pyxel.init(160, 120)

def update():
    if pyxel.btnp(pyxel.KEY_Q):
        pyxel.quit()

def draw():
    pyxel.cls(0)
    pyxel.rect(10, 10, 20, 20, 11)

pyxel.run(update, draw)

Pyxel 初めて触ったゲームエンジンですが、updateで毎フレームの内部状態を更新して、drawでレンダリングしてあげれば利用できるというシンプルな仕組みでとても書きやすかったです。 ドット絵を描くエディタやサウンド編集ツールなんかもついていてかなり凝ったゲームも作れそうです。今回は時間なくてシンプルなドットを描画するのみにとどまりましたがいつかちゃんとしたゲーム作りもチャレンジしたいです。

github.com

で、なんとか出来た対戦ゲームがこちら。 当たり判定に若干怪しいところとかがありますが、大きな理不尽なく遊べるくらいにはなりました。 コマンドラインの引数でチームのプログラムへのモジュールパスを受け取って対戦が可能になっています。

    def atk_action(self, info: GameInfo, state: State) -> int:
        return random.randint(-2, 2)

    def def_action(self, info: GameInfo, state: State) -> int:
        return random.randint(-1, 1)

各自に実装してもらうものも極力シンプルにしていて、毎フレームごとに呼び出される関数が何を返すかで前衛、後衛が上下に移動する仕組みになっています。 Python 不慣れでも苦なく動かせるのではないでしょうか。

pip で配布

Python で作ったゲーム、どうやって配布しようと思っていたのですが、pip で配布してしまえばいいのではという事に気づいてしまったので pongpy という名前で登録しました。 PC ゲームつくるならこの配布方式強いですね。アプリ化とか考えると Python では鬼門ですが…。

勉強会当日

チームビルディング

事前告知してインストールに支障がないかとかを見てもらいつつ、勉強会を迎えました。 最初にペア or ソロ参戦かでチームを作ってもらい、1時間強ほど実装を進めてもらいました。

f:id:nsmr_jx:20190322174456j:plain
作業風景
前衛と後衛で分担して実装をすすめてるチームが多かったですね。 後衛のほうが幅が広くボールがくるまで時間があるので、こっちを強化すると格段に勝ちやすくなります。

また1セットごとに左右が入れ替わって戦う仕組みをいれてあるのですが、ここへの対応をちゃんと入れないと前衛が自チーム側にボールを返して自爆してしまうみたいな罠があります。 実装の後回しになってしまいやすい部分ですがちゃんと考慮してくれたチームがいくつかあって開発者冥利に尽きました。

トーナメント

f:id:nsmr_jx:20190322173941p:plain
トーナメント

実装が出揃ったらいよいよトーナメント戦です。 GitLab にレポジトリを作って、マージリクエストという形でソースコードを出してもらいました。

f:id:nsmr_jx:20190322181628p:plain
観戦の様子
AirMac で画面をミラーリングすると Pyxel がエラーを吐いてしまうなどのトラブルがありましたが、1試合1分ほどで決着がつくので始まってからはサクサクと進みました。 やはり対戦状況が画面で見れるっていうのは楽しいですね。予想以上に盛り上がってよかったです。 (非エンジニアでも見て楽しめるので全社で観戦者募っても良かったかもしれない…。)

f:id:nsmr_jx:20190320200647g:plain
白熱の決勝戦
そして決勝戦です。かなり接戦でいい勝負していました。 前衛の青に当たると上下への振れ幅を大きく返せるので決め手になりやすいです。

f:id:nsmr_jx:20190322100102j:plain
優勝チーム
見事優勝した sugibayashi チームです👏 副賞として Pong にちなんだ ポンジュースがプレゼントされましました。

f:id:nsmr_jx:20190322155112g:plain
参考実装
ちなみに参考実装として用意していたボールの予測を実装したチーム同士の戦いです。 このチームに勝ってくれるのを密かに期待してましたが流石に1時間だと厳しかったみたいで…。 1日単位でハッカソンみたいな機会があったらまたぜひやってみたいですね。 DQNとかの機械学習を持ち出してくるチームもあると思いますし。