開発時に見るコマンド・ショートカット集

Docker Git 仕組みコマンドクローン〜プッシュ取り込み取り消しその他 Jupyter Notebook poetry Terminal tmux Vim VSCode Docker $ docker build -t sample_docker . $ docker run -itd -v $(pwd):/opt/mnt -p 18080:8080 sample_docker $ docker ps $…

2022-03-26

よく使うgitコマンド

技術全般

仕組みワーキングツリー - インデックスエリア - ローカルリポジトリ - リモートリポジトリ origin = リモートリポジトリのインデックス git remote -v で確認可能 git remote add aaa https://github.com/xxx/xxx.git で追加可能。（ aaa というインデック…

2021-10-30

VertexAIの疑問点

※WIP 全体対応リージョンの制限はあるか（tkyで利用できるか） AutoML、データセットなど含めてリリースバージョンはGAか Vertex AI Workbenchなど含めてデータ基盤（収集, 蓄積, 加工）データセットの利用シーン、利用方法は何か。BQ直接利用との違い（…

2021-10-24

ECSを復習してみた

構築手順・CICD設定 0. 全体構成 AmazonECS / Fargate 本番運用のための構築とデプロイ方法まとめから引用 1-1. Clusterの構築 Cluster: TaskとServiceをグルーピングする概念。アプリケーションごと、環境ごとに用意する。 Fargateだとネットワーキングのみ…

2021-10-10

MLOps導入に向けたヒアリングチェックリスト

技術全般

はじめに MLOpsの導入・改善を頼まれたときに、初手でヒアリングすることの簡単なチェックリストですヒアリング事項前提条件（現時点/これから） ☑︎プロジェクト（モデル）の種類需要予測 / 類似画像検索, etc ☑︎データの種類テーブルデータ / 画像 / …

2021-10-09

統計学チートシート

チートシート

ロードマップ統計学基礎チートシート

2021-10-09

機械学習シートシート

チートシート

ロードマップ Roadmap: How to Learn Machine Learning in 6 Months チートシート全般回帰、推薦（教師あり-予測対象が連続）分類（識別）（教師あり-予測対象が離散） PCA（教師なし-予測対象が連続）クラスタリング（教師なし-予測対象が離散）

2021-10-09

エンジニアリングチートシート

チートシート

ロードマップ DevOps Roadmap チートシートネットワークハードウェア OS データベースセキュリティ

2021-10-03

AWSのセキュリティ設定チェックリスト

技術全般

メモアイデンティティとアクセス管理 IAMユーザにMFA設定をする IAMユーザにIPアドレス利用制限をする IAMユーザのキーペアをハードコーディングせずIAMロールやCognitoで代替する IAMユーザのキーペアを利用するなら環境変数に設定する IAMのポリシーに職…

2021-08-29

nginx設定項目メモ

nginx設定項目メモ（一部）プロセス起動ユーザ user デーモン化 daemon foregroundかbackfroundか。デフォルトはon。（backfround）ワーカープロセス数 worker process マスタープロセスは1つのみですが、ワーカプロセスはワーカプロセス数をCPUのコア数…

2021-08-29

tcpdumpコマンド

技術全般

オプション（一部） -i : インターフェイス指定。tcpdump -Dで一覧確認する -n : IPアドレスをホスト名に変換させないで表示させる -nn : プロトコル名をポート番号で表示させる -A: 通信内容をASCIIで表示させる -w tcpdump.pcap: パケットキャプチャをファ…

2021-05-14

Kaggleスニペット

技術全般

テーブル pandas csv読み込み import pandas as pd df = pd.read_csv(INPUT_DATA_PATH_DIR + 'train.csv') df.columns pandas EDA import pandas_profiling as pdp pdp.ProfileReport(df) df_gb_label_group = pd.DataFrame({"count": df.groupby("label_gro…

2021-04-17

データエンジニアリング実践

技術全般

はじめにデータエンジニアリングまわりを復習したときのメモです。 Webアプリから発生するデータを使ってモデルを継続的に学習させるためのデータ基盤を想定しています。データエンジニアリング導入以前ver 概要 CSVファイル PoC時点などのシンプルな実装…

2021-04-11

Kaggleコンペ開始直後にやっていること

技術全般

はじめにはじめてKaggleのコンペに参加してみたので、初動でやったことの大まかな流れを備忘までに残しておきます。やったこと 0. 前提 Kaggleアカウントは作成しておくこと 1. コンペ参加登録 Kaggleページ→compete→sample_compete（対象コンペ）→Join Co…

2021-04-11

バックアップリストア改廃を復習してみた

技術全般

はじめにバックアップリストア改廃を復習してみたときのメモです 5W1Hを意識して漏れなく設計します一覧取得元サービス項目インスタンスバックアップ方式トリガタイミングリストア方式改廃（取得元）方式トリガローカル保存世代数改廃（バ…

2021-04-02

データエンジニアリングを復習してみた

技術全般

概要 -> データエンジニアリング実践も参照選定ポイント MPPデータベースは、最初にETLプロセスなどでデータを取り込むための手順が必要元のデータがCSVやJSONで、複雑な加工処理が不要なら、オブジェクトストレージからデータウェアハウスに直接転送してS…

2021-04-02

MLモデル評価で考えること

技術全般

はじめに MLモデル評価のまとめ方メモですメモ全体を通して、「つまり、現在実践で使えるレベルか？」「課題はどこで、クリアできそうか？それがクリアできたらどれくらい良くなりそうか？」が伝わるようにする網羅感大事 1. 検証計画再掲スコープ検証…

2021-03-24

Macの初期セットアップ手順メモ（vivaldi, vscode, xonsh, etc）（2021）

技術全般

はじめに Macを初期セットアップしたときのメモ。キーバインド設定システム環境設定 > キーボード > caps lock -> command(キーボードごとに) ctrlとcmdの入れ替え入力ソースにローマ字とABC システム環境設定 > キーボード > ショートカット > 入力ソー…

2021-02-21

fluentdとKinesisDataFirehostとlogrotateでログの収集とローテをする

技術全般

はじめに fluentd(EC2→CloudWatchLogs) + Kinesis Data Firehose(EC2→CloudWatchLogs → S3) でログの収集 logrotateでログのローテ・改廃（EC2） fluentdでログの収集 fluentdの仕組み 1つのメッセージは、[tag, time, record]で構成される流れ Inputプラグ…

2021-02-16

MLSE機械学習基盤本番適用と運用の事例・知見共有会参加レポート

イベント

はじめに MLSE 機械学習基盤本番適用と運用の事例・知見共有会を視聴させていただいたときのメモです。（Twitterコメントなども合わせてメモ）メモゼロから始めるKubeflowでの機械学習パイプライン構築 Reproさん Cloud Composer → Kubeflow プロセスに「…

2021-02-07

監視を復習してみた

技術全般

はじめに監視を復習してみたときのメモです参考入門監視検討項目とポイント 1. データ収集一般的にプルよりプッシュ（スケールしやすい）とりあえずOSのメトリクスとかを監視しがちだが、監視の目的から逆算すると、「動いているか」の監視が重要 HTTP…

2020-12-21

実験管理の現実的な導入ステップを考えてみた

技術全般

WIP 3. 【MLパイプラインの導入】解決できる課題ノートブックのみだと、処理が複雑に分岐するときなどに記述し辛い（バッチ処理として自動化し辛い）（前処理/後処理は共通だが、モデル学習部分は並行して色々な処理を試す、など）

2020-10-27

MLOps勉強会Tokyo(Online)#3参加レポート

イベント

はじめに第3回 MLOps 勉強会 Tokyo (Online)を視聴させていただいたときのメモですメモ異音検知プラットフォーム開発におけるMLOpsの実際と考察リサーチャ、ソフトウェアエンジニア、ユーザのそれぞれの目的 → 結局、ユーザが課題を解決するためにみんな…

2020-10-19

Webアプリケーションのアーキテクチャについて考えたこと

技術全般

はじめに自分でちょっとしたWebアプリケーションを開発するときに、構成をどうするか悩んだときのメモです。考えたこと Webアプリケーションフレームワーク比較 Gitスター数比較 Python 製 Web フレームワークを Flask から FastAPI に変えた話 Flaskと比…

2020-10-19

ネットワークを復習してみた

技術全般

はじめにネットワークを復習してみたときのメモです参考ネットワークはなぜ繋がるのかインフラエンジニアの教科書2 Amazon Web Service 基礎からのネットワーク&サーバー構築ネットワーク 1. Webブラウザがリクエストを作るリクエストメッセージリク…

2020-10-17

Terraformのディレクトリ構成について考えたこと

技術全般

前提小規模というほどではないが決して大規模ではない環境を組むときにちょうどいいTerraformのディレクトリ構成について悩んだときのメモです。環境ごとにVPCとかのネットワークを切って、それぞれにEC2(ECS)+RDS+S3とかとかを数台ずつ乗せていくくらい。…

2020-09-20

Terraformについて調べたことメモ

技術全般

はじめに Terraformまわりについて復習したときのメモメモディレクトリ構成案（最小構成） . ├── README.md └── stg01 ├── ec2.tf ├── provider.tf └── versions.tf ファイル例 ec2.tf resource "aws_instance" "<pj>-stg01-app-01" { ami = "ami-XXXXX" insta</pj>…

2020-08-22

MLOps勉強会Tokyo(Online)#1参加レポート

イベント

はじめに第1回 MLOps 勉強会 Tokyo (Online)を視聴させていただいたときのメモですメモ MLOpsコミュニティの発足にあたり DataRobot シバタさんアンケート作ったことあるモデル数: 1-10, 11-100がボリュームゾーン作ったモデルが本番に: 0が55% 可愛そ…

2020-08-21

DiscoveryDataScienceMeetup(DsDS)#0参加レポート

イベント

はじめに Discovery DataScience Meet up (DsDS) #0に参加させていただいたときのメモですメモ広告文自動生成プロダクトでDataflowを導入した話ダイレクトコピーの自動生成 Cloud Runでマイクロサービスを組んでいる分析はCompute Engineでやっている pa…

2020-08-18

スクラム開発でやっていること

マネジメント全般

はじめに SCRAM BOOT CAMP THE BOOKを読んで、実際に業務にスクラム（ぽいもの）を導入してみました。スクラム開発とはアジャイル開発のやり方の一つ「事前に全てを正確に予測し、計画することはできない」ということが前提となるプロジェクトにおいて、 …

nokoのブログ

こちらは暫定のメモ置き場ですので悪しからず

開発時に見るコマンド・ショートカット集

よく使うgitコマンド

VertexAIの疑問点

ECSを復習してみた

MLOps導入に向けたヒアリングチェックリスト

統計学チートシート

機械学習シートシート

エンジニアリングチートシート

AWSのセキュリティ設定チェックリスト

nginx設定項目メモ

tcpdumpコマンド

Kaggleスニペット

データエンジニアリング実践

Kaggleコンペ開始直後にやっていること

バックアップリストア改廃を復習してみた

データエンジニアリングを復習してみた

MLモデル評価で考えること

Macの初期セットアップ手順メモ（vivaldi, vscode, xonsh, etc）（2021）

fluentdとKinesisDataFirehostとlogrotateでログの収集とローテをする

MLSE機械学習基盤本番適用と運用の事例・知見共有会参加レポート

監視を復習してみた

実験管理の現実的な導入ステップを考えてみた

MLOps勉強会Tokyo(Online)#3参加レポート

Webアプリケーションのアーキテクチャについて考えたこと

ネットワークを復習してみた

Terraformのディレクトリ構成について考えたこと

Terraformについて調べたことメモ

MLOps勉強会Tokyo(Online)#1参加レポート

DiscoveryDataScienceMeetup(DsDS)#0参加レポート

スクラム開発でやっていること