レンコン畑でつかまえて

Rustでも画像がカラーかモノクロか判別したい

2025-01-19T00:00:00Z

はじめに

前回では画像をavifにして縮小する方法を確認したのですが、よくよく確認してみると明らかにモノクロ画像なのにカラープロファイルで保存されている画像とかもちらほらあったんですよね。

じゃあカラー画像かモノクロ画像か判別して、モノクロならビット深度を8bitに落とせばもっとサイズを縮小出来るのではということでカラーかモノクロか判別する方法を確認してみました。

画像が、白黒かカラーか判定する。(白黒に近いスキャン画像を判定する）- それマグで！

HSV（HSB）色空間に変換して、S(Saturation)×V(Value)の値を閾値で2値化してその平均値で判定すればうまく行くとのことです。

HSV色空間

さて、前回に引き続き画像ライブラリにはimage-rsを使っているので、HSV色空間に変換するメソッドがあれば一発で終わります。ありませんでした

ただ、RGBからHSVに変換するのはそんなに難しくないので、ここでは愚直に実装していきます。

RGB用に以下のmax、minなヘルパメソッドを定義して、

fn max(r: u8, g: u8, b: u8) -> u8 {
    if r > g && r > b {
        r
    } else if g > b && g > r {
        g
    } else {
        b
    }
}

fn min(r: u8, g: u8, b: u8) -> u8 {
    if r < g && r < b {
        r
    } else if g < b && g < r {
        g
    } else {
        b
    }
}

定義通りにSとVを計算するメソッドを実装します。なお、値域は文献によってまちまちなのですが、ここでは0から255までとして計算しています。

また、今回の計算ではHは使用しないので実装していません。

fn v(r: u8, g: u8, b: u8) -> u8 {
    max(r, g, b)
}

fn s(r: u8, g: u8, b: u8) -> u8 {
    let v = v(r, g, b);

    if v == 0 {
        0
    } else {
        (255f64 * ((max(r, g, b) as f64 - min(r, g, b) as f64) / max(r, g, b) as f64)) as u8
    }
}

判定

あとは画像を読み込んで1ピクセル毎にHSV色空間に変換して閾値から2値化して平均すれば完了です。

fn is_monochrome(img: &DynamicImage) -> f64 {
    let img = img.clone().into_rgb8();
    let mut sum = 0u32;
    let mut n = 0u32;

    // 2値化するときの閾値（今回は10%を使用している）
    let threshold = (256f64 * 256f64 * 0.1) as u32;
    for (_, _, pixel) in img.enumerate_pixels() {
        let r = pixel.0[0];
        let g = pixel.0[1];
        let b = pixel.0[2];

        // HSV色空間に変換
        let v = v(r, g, b);
        let s = s(r, g, b);
        let sv = s as u32 * v as u32;

        // 2値化
        if sv > threshold {
            sum += 1;
        }
        n += 1;
    }
    
    // 平均を計算
    let mean = sum as f64 / n as f64;
    mean
}

結果が0よりも大きければカラー、0ならモノクロと判別出来ると思います。たぶん

is-monochrome

おわり

RustでもAVIFフォーマットに変換して画像サイズを縮小したい

2025-01-02T00:00:00Z

はじめに

Rustとimage-rsを使ってjpeg画像などをAVIFフォーマットに変換して画像サイズを縮小するツールを作成したのでそれについてです。

cwebp

自炊したスキャン画像があり、普段はPCで参照していたのでWindows標準の画像ビューワで見ていました。しかし、諸般の事情で手元のiPhoneでも見れたほうがいいよねってことで画像ファイルを本ごとにブラウザで見れるようにSSGを使ってHTMLに起こしました。

宅内からでしか参照しないのでオリジナルサイズの画像をそのまま貼り付けても良かったのですが、画像数が32000程度あり取り回しやサーバへの転送でつらみポイントが高めだったので、ナウでヤングなファイルフォーマットを使って取り回しを良くしたいというのが作った動機です。

また、単純に画像を変換するだけならImageMagicを使えば良いと思いますが、画像を保存しているディレクトリ構造を保ったまま一括で変換してほしかったのでツールを作成しました。

最初はWebPフォーマットにしようとしましたが、ビット深度を落としてもオリジナルサイズの2倍くらいのサイズになってしまうのでAVIFフォーマットに切り替えたという経緯があります。

使用ライブラリ

Rustでの画像操作ライブラリはimage-rsを使っています。

オリジナルファイルは残す前提なので、ファイルサイズを縮小することを優先して変換を掛けています。

書籍系の画像なのでアルファチャネルは不要で、カラーはRGBでビット深度が24bit、モノクロははビット深度を8bitに落としています。

image-rsは書き出し時に指定するパスのファイルの拡張子からフォーマットを決めてくれるので、出力パスを決定する段階で拡張子.avifを付けています。

また、これは完全に私の管理が悪いのですが、たまに拡張子とファイルフォーマットが一致していないファイルがあったりします。そのため、画像を読み込むときは拡張子から読み込むフォーマットを決めているのではなく、ファイルから読み込んだ中身からファイルフォーマットを類推させています。

あとは、画像サイズをコマンドラインパラメータから指定できるようにし、画像サイズの縮小も同時に行っています。

fn convert(
    input: impl AsRef<Path>,
    output: impl AsRef<Path>,
    width: Option<u32>,
    height: Option<u32>,
) -> anyhow::Result<()> {
    let content = fs::read(&input)?;
    let img = ImageReader::new(Cursor::new(&content))
        .with_guessed_format()?
        .decode()?;

    let (cur_width, cur_height) = img.dimensions();
    let new_width = width.unwrap_or(cur_width);
    let new_height = height.unwrap_or(cur_height);
    let img = img.resize(new_width, new_height, FilterType::Lanczos3);

    let img: DynamicImage = match img.color() {
        ColorType::L8 | ColorType::La8 | ColorType::L16 | ColorType::La16 => {
            DynamicImage::from(img.into_luma8())
        }
        ColorType::Rgb8
        | ColorType::Rgba8
        | ColorType::Rgb16
        | ColorType::Rgba16
        | ColorType::Rgb32F
        | ColorType::Rgba32F => DynamicImage::from(img.into_rgb8()),
        _ => unreachable!(),
    };

    img.save(output)?;
    Ok(())
}

縮小比と処理時間

AVIFフォーマットの画像縮小は効果てきめんで、カラーならオリジナル比で40%、モノクロで60%くらいまで縮んでくれます。

ただし、処理時間がWebPフォーマットなどの比べるととても遅く、1ファイル当たり平均で811msくらい掛かります。 PNGなどが大体14mくらいなので、まぁ、うん、その、ねぇ・・・

おわり

2024年の振り返りとか

2024-12-31T00:00:00Z

はじめに

2024年の振り返りです。

Rust

プライベートでもあまり書けていませんでしたが、advoidのようにある程度実用的なプログラムを形に出来たのは良かったのかもしれません。 advoidは宅内のあまり重要ではない端末に対してDNSを提供していますが、今のところ問題を起こさずに安定して動いています。

来年はRustをメインで書けるようなお仕事を探してみても良いのかなと思っています。

資格とか

今年は勘違いから応用情報を受験しました。

勘違いで受験したのはもう少し確認しろよの一言ですが、会場の雰囲気が分かったり来年受けようと思っているネスペの午前Ⅰが免除になったので全体的には良かったのかなと思います。

ある程度の実務経験があるエンジニアならあんまり勉強しなくても合格出来ると思うので、試しに受験してみるのもいいかもしれません。

ブログ

今のドメインに移行して2年位まともにGoogleにインデックスされませんでしたが、最近インデックスされるようになりました。特に何かをいじったわけではないので、インデックスされない期間が終わったということなんだと思います。

だから何だというわけではないのですが、今後は検索に引っかかるようになるので私がうれしいというお話です。

あと、最近は記事をあまり書いてこなかったのですが、そのせいか昔に比べて文章を書く能力が低下している気がしています。接続詞や言い回しがパッと出てこないんですよね。

なので、今年は記事を書くペースを上げていきたいです。

おわりに

来年も良い感じに頑張りたいと思います。

応用情報技術者試験に合格していたお話

2024-12-28T00:00:00Z

はじめに

2024年秋の応用情報技術者試験を受験して合格していたのでそのお話です。

それなりに実務経験を積んではいるがめんどくさくて基本情報や応用情報を今まで受けてこなかった人が、気まぐれや必要に迫られて受けることになった際に参考になるように記録として残しておこうと思います。

受験した経緯

私の本業はアプリケーション開発なのですが、仕事ではネットワークに触れる機会がそれなりに多いという謎の経歴を持っています。それじゃということで勉強がてらネットワークスペシャリストが欲しいなと思っていました。

それで私は何を勘違いしていたのか、高度情報処理技術者試験は応用情報技術者が前提になっていると勘違いしていました。多分応用情報を持っていれば午前Ⅰの試験が免除になるという話と混ざっていたのだと思います。

そんなこともあり、ロクに調べることもなく応用情報技術者試験を申し込んでしまったというのが事の経緯となります。

試験会場の雰囲気

私はつくばの国際会議場で受験したので、他の会場のだと勝手が違うかもしれませんので最初に断っておきます。

会場には受付があるのかなと思っていましたが、「APはあちら」位の案内が貼ってあるだけでした。

また、試験室には試験開始30分前？位までは入れないので、あまり早く到着しても無駄にソワソワするだけです。入室できる時間になると案内がされるので、受験票の番号にしたがって部屋に入って指定された席に着くという感じです。

なお、ホテルを借りた会場では机と椅子の高さが合ってないみたいなツイートがありましたが、普通の机と普通の椅子で特にそんなことはなく、さすが国際会議場といったところです。

コンビニが微妙に遠いので、お昼ご飯はあらかじめ買っておいたほうが無難です。あと、午後試験の直前はトイレがめっちゃ混みます。気を付けましょう

試験の難易度

午前試験

範囲が広いので過去問をまんべんなくやっておいたほうがいいかもしれません。ただし、選択式なのでその分野を深く知っておくというよりかは単語とその意味を知っているか位の感じで良いと思います。まぁ、参考書を1～2周して、ちょっと苦手な部分を重点的にやっておく位で大丈夫です。

また、割と時流を抑えているようで、2024年の秋試験ではオブジェクトストレージやLLMのファインチューニングを問う問題が出ていました。対して、昔のメインフレームの文脈で使われることの多かったデュプレックスシステムやデュアルシステムは出てこなかった気がします。今後はクラウド系の知識を問う問題が増えると思います。

待ち行列や2分探索木、ハッシュ関数や逆ポーランド記法などの鉄板はやっておいたほうが良いです。出ます

午後試験

カテゴリが選択式で範囲が狭まる分、午前よりは深い理解を問われます。

とはいえ、セキュリティならパスワードのハッシュ化や組み合わせの数、ネットワークならパケットフィルタやルーティングテーブルなどそのカテゴリの基本的な知識を問うレベルですのでそんなに身構えなくても良いかもです。

カテゴリは決まっているようなので、自分が得意とする分野をあらかじめ見繕って勉強しておけば良いんじゃないかなと思います。

あと、漢字〇文字で書け系の問題も割と出ます。私は「多層防御」の「御」を思い出せずに帰りの迎えの車の中で思い出しました。

また、午後試験は割と焦りやすいので落ち着いて問題文を読むようにしたほうが良いですね。私も焦って解いて見直しで結構手直しをすることが多かったです。

おわり

WindowsでもOpenJDKを野良ビルドしたい

2024-12-20T00:00:00Z

はじめに

OpenJDKの中身をいじって検証する必要があったので、WindowsでOpenJDKを野良ビルドする方法を確認してみました。

最新のバージョンならOpenJDKの公式Wikiのビルドのページを参照すればいいですが、古いバージョンはリポジトリ内のdocsフォルダの中身を確認する必要があります。（1敗）

また、基本的にバージョンが下るほどビルド難易度が上がっていきます。

古いバージョンだと過去のVisual StudioとかWindowsバージョンが必要っぽいですが、流石に個人でVisual Studio Subscriptionを契約していないので基本的にWindows 11 + Visual Studio 2022でビルドしていきます。

必要なもの

OpenJDKの公式リファレンス曰く、英語版のWindowsのみを公式でサポートしているらしいです。そのため、何らかの合法的な手段で英語版のWindowsを調達するか、ロケールを英語に変更してください。

そうしたら以下の開発ツールをインストールします。

Visual Studio 2022
- 「Desktop development with C++」ワークロード
Cygwin
- autoconf
- make
- zip
- unzip
git（GitHubからソースをクローンしてくるなら）
ビルド済みのJDK（ビルドしたいOpenJDKのバージョンかその一つ前のバージョン）
JTReg（リグレッションテストを回すなら）
googletest（hotspotのテストを回すなら）

ソースをzipで落としてくるのであれば、ファイル数がとても多いので7zipなどのアーカイバを使って解凍したほうがいいかもしれません。

ビルド

どのバージョンでもbuild\windows-x86_64-server-release\jdkにバイナリが吐かれています。

大体どのバージョンでも手元のマシンだとビルドで30分位、test-tier1で2時間位掛かるのでゆっくりしていってね！！！

あと、ビルドに時間が掛かるからって調子に乗って複数バージョンの同時ビルドを流すと、たまにテストがタイムアウトしてError扱いになるので注意しましょう。（4敗）

OpenJDK 23 (23.0.1-11)

最新ならとっても簡単です。

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-23.0.1+11 \
--with-jtreg=/cygdrive/c/java/jtreg \
--with-gtest=/cygdrive/c/src/googletest-1.14.0

make all; make test-tier1

OpenJDK 22 (22.0.2-9)

22までならなんの捻りもなくビルドが通ります。

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-22.0.2+9 \
--with-jtreg=/cygdrive/c/java/jtreg \
--with-gtest=/cygdrive/c/src/googletest-1.14.0

make all; make test-tier1

OpenJDK 21 (21.0.6-6)

最新のLTSですが、googletestを有効にするとビルドに失敗するようになります。ここから雲行きが怪しくなります。

とりあえずバイナリが欲しいので、googletestを無効にしてビルドを進めます。

 bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-21.0.5+11 \
--with-jtreg=/cygdrive/c/java/jtreg

googletestを無効化したせいでいくつかのhotspotテストが失敗として報告されますが、動くので多分問題ないでしょう。

make all; make test-tier1

OpenJDK 20 (20.0.2-ga)

ビルド中にワーニング出てきて若干不穏な感じになりますが、まぁビルドが通るので良しとしましょう。

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-20.0.2+9 \
--with-jtreg=/cygdrive/c/java/jtreg

20からgoogletest起因以外でテストが1件失敗し始めます。

make all; make test-tier1

OpenJDK 19 (19.0.2-ga)

bash configure \
--with-boot-jdk/cygdrive/c/java/jdk-19.0.2+7 \
--with-jtreg=/cygdrive/c/java/jtreg

make all; make test-tier1

OpenJDK 18 (18.0.2.1-0)

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-18.0.2.1+1 \
--with-jtreg=/cygdrive/c/java/jtreg

make all; make test-tier1

OpenJDK 17 (17.0.14-6)

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-17.0.13+11 \
--with-jtreg=/cygdrive/c/java/jtreg

make all; make test-tier1

OpenJDK 16 (16.0.2-ga)

Visual Studioのビルド環境の検出に失敗してbash configure自体が失敗します。

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-16.0.2+7 \
--with-jtreg=/cygdrive/c/java/jtreg

configure: Using default toolchain microsoft (Microsoft Visual Studio)
configure: error: Cannot locate a valid Visual Studio installation
configure exiting with result code 1

OpenJDK 11 (11.0.26-3)

11はまだビルドが通ります。いつまで使う気なんでしょうね

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk-11.0.25+9 \
--with-jtreg=/cygdrive/c/java/jtreg

make all; make run-test-tier1

OpenJDK 8 (jdk8u442-b04)

u442ってもはや何なんだよって感じです

bash configure \
--with-boot-jdk=/cygdrive/c/java/jdk8u432-b06 \
--with-jtreg=/cygdrive/c/java/jtreg \
--with-freetype-src=/cygdrive/c/src/freetype-2.5.3

bash configureまでは通るけど、ビルドはコケます。

make all

おわり

Docker Buildxでもキャッシュしたい

2024-09-14T00:00:00Z

はじめに

しばらくぶりにDockerに触ったらなんかいろいろとキャッシュ周りが変わっていたのでそれについてです。

Buildx

どうも最近のDockerはMoby BuildKitをdockerコマンドから透過的に扱えるようになったようです。そして、BuildKitをDockerから使うための拡張がBuildxです。

BuildKit君はいい感じにキャッシュを扱えるようなので、その辺を確認してみましょう。

パッケージマネージャ

APT

昔はapt-getコマンドを鬼のように&&で連結して、最後にrm -rf /var/lib/apt/lists/*でキャッシュファイルを消し飛ばしてイメージをコンパクションするのがノウハウでした。

そうすると、イメージサイズは小さくなりますが毎回パッケージをダウンロードしてくることになるので、ビルド時間が伸びるという欠点がありました。

BuildKitは特定のディレクトリをキャッシュとしてマウントすることで、イメージの再ビルド時にそのディレクトリを復元することができます。

FROM debian:bookworm

RUN rm -f /etc/apt/apt.conf.d/docker-clean; \
    echo 'Binary::apt::APT::Keep-Downloaded-Packages "true";' \
      > /etc/apt/apt.conf.d/keep-cache

RUN --mount=type=cache,target=/var/cache/apt,sharing=locked \
    --mount=type=cache,target=/var/lib/apt,sharing=locked \
    set -eux; \
    apt-get update; \
    apt-get install -y --no-install-recommends \
      sl;

apt-getのタイミングでリポジトリキャッシュをcacheタイプでマウントしています。こうすることで2回目以降は普通のaptのようにパッケージキャッシュを使ってくれるようです。

ところで、初段のステージで/etc/apt/apt.conf.d/docker-cleanを消し去ってますね。

Dockerだとキャッシュが刺さってイメージが肥大化するからaptの最後にキャッシュを消し飛ばすようにしている設定ファイルのようです。

じゃあ何すか

rm -rf /var/lib/apt/lists/*は無駄だったって事すか

DNF

DNF君も基本的には同じです。

Amazon Linux 2023のベースイメージではダウンロードキャッシュをしないようにしていたので、ダウンロードキャッシュをする設定を挟んでからdnf installします。

FROM amazonlinux:2023

RUN echo "keepcache=True" >> /etc/dnf/dnf.conf

RUN --mount=type=cache,target=/var/cache/dnf \
    --mount=type=cache,target=/var/lib/dnf \
    dnf install -y \
      gcc gcr lvm2 clang

YUM

CentOS7がEoLを迎えてもうyumコマンドを打つ機会はない。そんなふうに考えていた時期が俺にもありました

AWS Lambdaの（少なくともPythonの）ベースイメージがAmazon Linuxが2なんですよね。

FROM amazonlinux:2

RUN sed -i -e 's/keepcache=0/keepcache=1/' /etc/yum.conf

RUN --mount=type=cache,target=/var/cache/yum \
    yum install -y \
      gcc gcr lvm2 clang

ビルドシステム

Rust

ビルド激重Rust君です。

FROM rust:1.81.0-slim AS build

WORKDIR /app

RUN --mount=type=bind,source=src,target=src \
    --mount=type=bind,source=Cargo.toml,target=Cargo.toml \
    --mount=type=bind,source=Cargo.lock,target=Cargo.lock \
    --mount=type=cache,target=/app/target/ \
    --mount=type=cache,target=/usr/local/cargo/git/db \
    --mount=type=cache,target=/usr/local/cargo/registry \
    set -eux; \
    cargo build --locked --release; \
    cp ./target/release/hello_rust /bin/hello_rust

FROM debian:stable-slim AS final
COPY --from=build /bin/hello_rust /bin/hello_rust
ENTRYPOINT ["/bin/hello_rust"]

ソース類はbindでマウントしてしまえばそもそもビルドステージへの転送すら不要なようです。

あとはcargoのパッケージキャッシュとビルドキャッシュをcacheでバインドすれば余計なパッケージの再取得やリビルドが走りません。

あとはいつものように最終的なイメージをビルドしているステージに成果物を送り込めば完了です。

Python

最近触っているのでまぁ一応Pythonも確認してみましょう。

FROM python:3.12-bookworm

RUN --mount=type=bind,source=requirements.txt,target=requirements.txt \
    --mount=type=cache,target=/root/.cache/pip \
    pip install -r requirements.txt

COPY main.py .

CMD ["python", "main.py"]

Rustと同じようにパッケージマネージャのキャッシュをそのままcacheでマウントするだけです。

おわり

Windowsでもpyenvを使いたい

2024-07-09T00:00:00Z

はじめに

Pythonの特定のバージョンをグローバルに影響させたくないのでpyenv-winを使っているのですが、セットアップをよく忘れるのでそれについてです。

初回セットアップ

pyenv-winをホームディレクトリにクローンします。

git clone git@github.com:pyenv-win/pyenv-win.git .pyenv

そうしたら以下の環境変数を設定します。

環境変数	値
`PYENV`	`%USERPROFILE%\.pyenv\pyenv-win`
`PYENV_HOME`	`%USERPROFILE%\.pyenv\pyenv-win`
`PYENV_ROOT`	`%USERPROFILE%\.pyenv\pyenv-win`

また、以下の2つをPAHTに追加します。

%USERPROFILE%\.pyenv\pyenv-win\bin
%USERPROFILE%\.pyenv\pyenv-win\shims

また、「設定 > アプリ > アプリの詳細設定 > アプリ実行エイリアス」からpython.exeとpython3.exeをオフにします。

アプリ実行エイリアス君は再起動しないと効かないっぽいのでいったん再起動します。

Pythonランタイムのインストール

pyenv install --list

でインストール可能なPythonバージョンを表示させ、

pyenv install 3.11.9

でインストールします。

ローカルフォルダのセットアップ

ローカルフォルダで使うPythonのバージョンをセットアップします。

pyenv local 3.11.9

そうしたらvenv環境を作成します。

python -m venv .venv

venv環境を有効にします。

.\.venv\Scripts\Activate.ps1

いったんpipを最新版に更新します。

python -m pip install --upgrade pip

パッケージのインストール

パッケージのインストール。

pip install polars

インストール済みのパッケージを出力。

pip freeze > requirements.txt

requirements.txtファイルからインストール。

pip install -r requirements.txt

一括アンインストール。

python -m pip uninstall -y -r .\requirements.txt

RustでもDNSベースのアドブロッカーを実装したい

2024-06-03T00:00:00Z

はじめに

最近は履歴に介入したり勝手に全画面表示してくるｱﾚなWeb広告が増えてきましたよね。

というのは特に関係なく、なんとなく手持ちの知識で作れそうなのでアドブロッカーを自作しました。

advoid - DNS based AD blocker

動作原理

基本的な原理はフルリゾルバのクライアントの間に挟まり、広告を配信しているドメインのクエリをインターセプトしてNXDOMAINを返すというよくあるものです。ですので、基本的には配下の端末全体で広告をブロック出来るようになります。

あくまでも上位のフルリゾルバへのクエリをフィルタリングしているだけなので、advoid自体にはキャッシュは持っていません。

また、正規の実装であればNXDOMAINを返すときはネガティブキャッシュをさせるためにSOAレコードも返すべきです。しかし、フィルタリング自体はadvoidの内部で行っており、ブロック対象のレコードに対してはμsオーダーでレスポンスを返せているためわざわざSOAを上位のフルリゾルバに問い合わせるよりも空で返したほうが速いと思って返していません。

実装コンセプト

手軽に使えるようにバイナリのポン置きとブロックするドメインの定義ファイルだけで動作するようになっています。

実装には最近お気に入りのRustを使用しており、クエリの待ち受けやフルリゾルバへクエリをフォワーディングするのにはhickory-dnsを利用しています。

また、どれだけのリクエストを受け取ってどれだけブロックしたか確認できるようにPrometheusのexporterを生やしています。まぁ、カウンタは今のところ3つしかありませんが。

# TYPE dns_requests_total counter
dns_requests_total 4149

# TYPE dns_requests_block counter
dns_requests_block 3583

# TYPE dns_requests_forward counter
dns_requests_forward 566

また、デバッグしているときに欲しかったのでOpenTelemetryでテレメトリを採れるようにしてあります。Jaegerとセットでどうぞ

おわりに

とりあえず単純なフォワーディングとフィルタリングは出来るようになったのですが、TCPフォールバックとかActive Directory配下のDynamic DNSの透過とかはまだなので追い追い実装していきます。

おわり

RustでもHickory DNSを使ってDNS Forwarderを実装したい

2024-04-01T00:00:00Z

はじめに

DNSは春の季語なので、Hickory DNSを使用してDNS Forwarderを実装する方法を確認してみました。

とにかくドキュメントの整備が追い付いていないので、困ったらソースコードを読みましょう。これがオープンソースの強みですね（）

とりあえず適当な値を返す

Hickory DNSでのサーバ実装はhickory_serverクレートで実装されています。

hickory_serverでのアクセスの受付はServerFutureに実装されています。 ServerFuture::newでRequestHandlerトレイトを受け取るので、このトレイトを実装すればとりあえずなんらかの値は返せそうです。

と思ってdocs.rsで当該トレイトのドキュメントを見ると、面妖なシグネチャが現れます。

pub trait RequestHandler: Send + Sync + Unpin + 'static {
    // Required method
    fn handle_request<'life0, 'life1, 'async_trait, R>(
        &'life0 self,
        request: &'life1 Request,
        response_handle: R
    ) -> Pin<Box<dyn Future<Output = ResponseInfo> + Send + 'async_trait>>
       where R: 'async_trait + ResponseHandler,
             Self: 'async_trait,
             'life0: 'async_trait,
             'life1: 'async_trait;
}

まぁ、この手のシグネチャは大体#[async_trait::async_trait]で生成されているパターンが多いので、落ち着いて実装を覗いてみると以下の感じになってます。

/// Trait for handling incoming requests, and providing a message response.
#[async_trait::async_trait]
pub trait RequestHandler: Send + Sync + Unpin + 'static {
    /// Determines what needs to happen given the type of request, i.e. Query or Update.
    ///
    /// # Arguments
    ///
    /// * `request` - the requested action to perform.
    /// * `response_handle` - handle to which a return message should be sent
    async fn handle_request<R: ResponseHandler>(
        &self,
        request: &Request,
        response_handle: R,
    ) -> ResponseInfo;
}

hickory_serverではCatalogがデフォルトの実装なので、そのコードを参考に決め打ちのIPを返すように実装します。

struct StubRequestHandler {}

impl StubRequestHandler {
    pub fn new() -> Self {
        StubRequestHandler {}
    }
}

#[async_trait::async_trait]
impl RequestHandler for StubRequestHandler {
    async fn handle_request<R: ResponseHandler>(
        &self,
        request: &Request,
        mut response_handle: R,
    ) -> ResponseInfo {
        let result = match request.message_type() {
            MessageType::Query => match request.op_code() {
                OpCode::Query => {
                    let a = A::new(203, 0, 113, 1);
                    let rd = RData::A(a);
                    let r =
                        Record::from_rdata(request.query().name().into_name().unwrap(), 3600, rd);
                    let response = MessageResponseBuilder::from_message_request(request);
                    let response =
                        response.build(*request.header(), vec![&r], vec![], vec![], vec![]);
                    response_handle.send_response(response).await
                }
                _op => {
                    let response = MessageResponseBuilder::from_message_request(request);
                    response_handle
                        .send_response(response.error_msg(request.header(), ResponseCode::NotImp))
                        .await
                }
            },
            MessageType::Response => {
                let response = MessageResponseBuilder::from_message_request(request);
                response_handle
                    .send_response(response.error_msg(request.header(), ResponseCode::NotImp))
                    .await
            }
        };

        result.unwrap_or_else(|_e| {
            let mut header = Header::new();
            header.set_response_code(ResponseCode::ServFail);
            header.into()
        })
    }
}

QUERYにのみ反応し、それ以外はNOTIMPを返しています。

あとは、いい感じにmainを実装してあげます。

#[derive(Parser, Debug)]
struct Cli {
    /// Bind address
    #[clap(long)]
    bind: SocketAddr,
}

#[tokio::main]
async fn main() -> anyhow::Result<()> {
    let opt = Cli::parse();

    let socket = UdpSocket::bind(&opt.bind).await?;
    let handler = StubRequestHandler::new();
    let mut server = ServerFuture::new(handler);
    server.register_socket(socket);
    server.block_until_done().await?;

    Ok(())
}

❯ dig @192.168.2.32 www.jyuch.dev
;; Warning: query response not set

; <<>> DiG 9.18.18-0ubuntu2.1-Ubuntu <<>> @192.168.2.32 www.jyuch.dev
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 37403
;; flags: rd ad; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0
;; WARNING: recursion requested but not available

;; QUESTION SECTION:
;www.jyuch.dev.                 IN      A

;; ANSWER SECTION:
www.jyuch.dev.          3600    IN      A       203.0.113.1

;; Query time: 0 msec
;; SERVER: 192.168.2.32#53(192.168.2.32) (UDP)
;; WHEN: Sun Mar 31 19:52:46 JST 2024
;; MSG SIZE  rcvd: 47

DNS Fordingする

DNSのクライアント側の実装はhickory_clientクレートにあります。

せっかくtokioを使ってるので、上流に問い合わせるためのクライアントとしてAsyncClientを使ってみます。

struct StubRequestHandler {
    upstream: Arc<Mutex<AsyncClient>>,
}

impl StubRequestHandler {
    pub fn new(upstream: Arc<Mutex<AsyncClient>>) -> Self {
        StubRequestHandler { upstream }
    }
}

#[async_trait::async_trait]
impl RequestHandler for StubRequestHandler {
    async fn handle_request<R: ResponseHandler>(
        &self,
        request: &Request,
        response_handle: R,
    ) -> ResponseInfo {
        let result = match request.message_type() {
            MessageType::Query => match request.op_code() {
                OpCode::Query => {
                    let upstream = &mut *self.upstream.lock().await;
                    forward_to_upstream(upstream, request, response_handle).await
                }
                _op => server_not_implement(request, response_handle).await,
            },
            MessageType::Response => server_not_implement(request, response_handle).await,
        };

        result.unwrap_or_else(|_e| {
            let mut header = Header::new();
            header.set_response_code(ResponseCode::ServFail);
            header.into()
        })
    }
}

async fn forward_to_upstream<R: ResponseHandler>(
    upstream: &mut AsyncClient,
    request: &Request,
    mut response_handle: R,
) -> anyhow::Result<ResponseInfo> {
    let response = upstream
        .query(
            request.query().name().into_name().unwrap(),
            request.query().query_class(),
            request.query().query_type(),
        )
        .await?;

    let response_builder = MessageResponseBuilder::from_message_request(request);
    let response = response_builder.build(
        *request.header(),
        response.answers(),
        vec![],
        vec![],
        vec![],
    );
    let response_info = response_handle.send_response(response).await?;

    Ok(response_info)
}

async fn server_not_implement<R: ResponseHandler>(
    request: &Request,
    mut response_handle: R,
) -> anyhow::Result<ResponseInfo> {
    let response = MessageResponseBuilder::from_message_request(request);
    let response_info = response_handle
        .send_response(response.error_msg(request.header(), ResponseCode::NotImp))
        .await?;

    Ok(response_info)
}

あとはいい感じにAsyncClientを構築してStubRequestHandlerに渡してあげればOKです。

#[derive(Parser, Debug)]
struct Cli {
    /// Bind address
    #[clap(long)]
    bind: SocketAddr,

    /// Upstream address
    #[clap(long)]
    upstream: SocketAddr,
}

#[tokio::main]
async fn main() -> anyhow::Result<()> {
    let opt = Cli::parse();

    let conn = UdpClientStream::<UdpSocket>::new(opt.upstream);
    let (upstream, background) = AsyncClient::connect(conn).await?;
    let _handle = tokio::spawn(background);
    let handler = StubRequestHandler::new(Arc::new(Mutex::new(upstream)));

    let socket = UdpSocket::bind(&opt.bind).await?;
    let mut server = ServerFuture::new(handler);
    server.register_socket(socket);
    server.block_until_done().await?;

    Ok(())
}

❯ dig @192.168.2.32 www.jyuch.dev
;; Warning: query response not set

; <<>> DiG 9.18.18-0ubuntu2.1-Ubuntu <<>> @192.168.2.32 www.jyuch.dev
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 7791
;; flags: rd ad; QUERY: 1, ANSWER: 5, AUTHORITY: 0, ADDITIONAL: 0
;; WARNING: recursion requested but not available

;; QUESTION SECTION:
;www.jyuch.dev.                 IN      A

;; ANSWER SECTION:
www.jyuch.dev.          300     IN      CNAME   jyuch.github.io.
jyuch.github.io.        3600    IN      A       185.199.111.153
jyuch.github.io.        3600    IN      A       185.199.109.153
jyuch.github.io.        3600    IN      A       185.199.108.153
jyuch.github.io.        3600    IN      A       185.199.110.153

;; Query time: 28 msec
;; SERVER: 192.168.2.32#53(192.168.2.32) (UDP)
;; WHEN: Sun Mar 31 20:31:41 JST 2024
;; MSG SIZE  rcvd: 124

追記その１

リクエストヘッダをそのままレスポンスヘッダとして打ち返していましたが、そうするとsystemd-resolvedが受け取り拒否します。 Windowsはあんまり気にしていないみたいですけど。

正しくは以下の感じですね。

let response_header = Header::response_from_request(request.header());
let response_builder = MessageResponseBuilder::from_message_request(request);
let response = response_builder.build(
    response_header,
    dns_response.as_ref().map(|it| it.answers()).unwrap_or(&[]),
    &[],
    &[],
    &[],

digの結果の一行目に警告が載ってましたね・・・

;; Warning: query response not set

追記その２

単純にHeader::response_from_requestするとレスポンスヘッダに再起フラグが立たないので、上位DNSからのレスポンスヘッダに再起フラグが立っていたら立ててあげる必要があるようです。

let mut response_header = Header::response_from_request(request.header());
response_header.set_recursion_available(response.recursion_available());

でないとこんな警告がでます。というか出てましたね。ちゃんと読めよ

;; WARNING: recursion requested but not available

おわり

RustでもOTLPでJaegerにテレメトリを送りたい

2023-09-18T00:00:00Z

2024年12月29日追記

RustのOpenTelemetryライブラリはまだ安定化されておらず、割とドラスティックにAPIが更新されています。

そのため、現時点の最新のライブラリを使おうとして下のコードをコピペしてもビルドが通らないと思います。

拙作のadvoidのtrace.rsは割と最近のバージョンへの追従を頑張っているので、良かったらそちらを参考にしてみてください。

はじめに

テキストベースのロギングは時代遅れ、時代はOpenTelemetryを使ったハイカラな計装！！ということでタイトル通りに試してみます。

とはいってもRust関係でまとまった記事を書いてくださってるのは以下のブログくらいみたいなので、とりあえずは以下の記事を参考に試してみます。

RustでOpenTelemetryをはじめよう

OpenTelemetry

OpenTelemetryはそれぞれの監視ツールベンダが提供してきたAPIを共通化し、アプリケーションコードから可能な限りベンダ固有のコードを除去することを目的としてる。と個人的に認識しています。

例えばNew RelicからAWS X-Rayに監視バックエンドを変更しようとした際、OpenTelemetryを使用していればアプリケーションのコネクタ部分だけ変えればすぐにメトリクスの送信先を変えられるといった感じらしいです。

今回はシングルバイナリでサクッと建てられるJaegerを使います。

setlocal

set BASE_DIR=%~dp0

set SPAN_STORAGE_TYPE=badger
set BADGER_EPHEMERAL=false
set BADGER_DIRECTORY_VALUE=C:\path\to\.jaeger\data
set BADGER_DIRECTORY_KEY=C:\path\to\.jaeger\key

start http://localhost:16686 
call %BASE_DIR%jaeger-all-in-one.exe

endlocal

みたいなバッチを作っておくとサクッと立ち上げられるので便利です。

tracingの初期化

今回はトレーシングライブラリとしてtokio-rs/tracingを使用します。

tracingのレイヤーとしてOpenTelemetryのテレメトリを送信するControllerを差し込みます。

tracing自体はtokioには依存せず使用できますが、テレメトリの送信にgRPCを使用しており、gRPCがtonicを使用しているため自動的にtokioに依存することになります。が、そこそこの規模のアプリケーションを開発する場合ほぼtokioを使うことになると思うので特に気にしなくても良いと思います。

use opentelemetry::sdk::metrics::controllers::BasicController;
use opentelemetry_otlp::WithExportConfig;

pub(crate) struct OtelInitGuard();

impl Drop for OtelInitGuard {
    fn drop(&mut self) {
        opentelemetry::global::shutdown_tracer_provider();
    }
}

// https://github.com/open-telemetry/opentelemetry-rust/blob/d4b9befea04bcc7fc19319a6ebf5b5070131c486/examples/basic-otlp/src/main.rs#L35-L52
fn build_metrics_controller() -> BasicController {
    use opentelemetry::sdk::export::metrics::aggregation::cumulative_temporality_selector;
    use opentelemetry::sdk::metrics::selectors::simple::histogram;

    opentelemetry_otlp::new_pipeline()
        .metrics(
            histogram(Vec::new()),
            cumulative_temporality_selector(),
            opentelemetry::runtime::Tokio,
        )
        .with_exporter(
            opentelemetry_otlp::new_exporter()
                .tonic()
                .with_endpoint("http://localhost:4317"),
        )
        .build()
        .expect("Failed to build metrics controller")
}

pub(crate) fn init_tracing(service: &'static str, version: &'static str) -> OtelInitGuard {
    use opentelemetry::sdk::trace::{RandomIdGenerator, Sampler};

    // Configure otel exporter.
    let tracer = opentelemetry_otlp::new_pipeline()
        .tracing()
        .with_exporter(
            opentelemetry_otlp::new_exporter()
                .tonic()
                .with_endpoint("http://localhost:4317"),
        )
        .with_trace_config(
            opentelemetry::sdk::trace::config()
                .with_sampler(Sampler::AlwaysOn)
                .with_id_generator(RandomIdGenerator::default())
                .with_resource(opentelemetry::sdk::Resource::new(vec![
                    opentelemetry::KeyValue::new("service.name", service),
                    opentelemetry::KeyValue::new("service.version", version),
                ])),
        )
        .install_batch(opentelemetry::runtime::Tokio)
        // .install_simple()
        .expect("Not running in tokio runtime");

    // Compatible layer with tracing.
    let otel_trace_layer = tracing_opentelemetry::layer().with_tracer(tracer);
    let otel_metrics_layer = tracing_opentelemetry::MetricsLayer::new(build_metrics_controller());

    use tracing_subscriber::layer::SubscriberExt;
    use tracing_subscriber::util::SubscriberInitExt;

    tracing_subscriber::Registry::default()
        .with(tracing_subscriber::fmt::Layer::new())
        .with(otel_trace_layer)
        .with(otel_metrics_layer)
        .with(tracing_subscriber::filter::LevelFilter::INFO)
        .init();

    OtelInitGuard()
}

アプリケーションコード

起動時にOpenTelemetryの初期化さえしてしまえば、あとは普通にtracingを使うだけです。

メソッドに#[instrument]を貼れば自動的にSpanを作ってコンテキストを埋め込んでくれるので便利です。

mod otl;

use crate::otl::init_tracing;
use tracing::{error, info, instrument};

#[instrument]
async fn start(x: i32, y: i32) -> Option<i32> {
    add(multiply(x, y).await, multiply(x, y).await).await
}

#[instrument]
async fn add(x: i32, y: i32) -> Option<i32> {
    let ans = x + y;

    if ans <= 10 {
        info!(
            ans = ans,
            "特に出すべきログがないからとりあえず適当なメッセージを出しています"
        );
        Some(ans)
    } else {
        error!(ans = ans, "something went wrong");
        None
    }
}

#[instrument]
async fn multiply(x: i32, y: i32) -> i32 {
    x * y
}

#[tokio::main]
async fn main() {
    let service = env!("CARGO_PKG_NAME");
    let version = env!("CARGO_PKG_VERSION");

    let _guard = init_tracing(service, version);

    let value = start(1, 2).await;
    println!("{:?}", value);

    let value = start(10, 22).await;
    println!("{:?}", value);
}

jyuch/tracing_otlp