libsoundio-sharpとPInvokeGeneratorについて

このエントリはC# Advent Calendar 2017の7日目のエントリです。6日目のあめいさん @amay077 のエントリからのバトンを引き継いでいます。

まえがき

.NETエコシステムに圧倒的に足りないもののひとつが、クロスプラットフォームサウンドAPIです。サウンドAPIは伝統的にプラットフォーム固有のものであり(例: NAudioCSCore)、SharpDX)、これらはクロスプラットフォーム アプリケーションで使うことはできません。これではC#クロスプラットフォームサウンド系アプリケーションが書かれる日は未来永劫来ないでしょう。

クロスプラットフォームサウンド系アプリケーションなんてあるんでしょうか? あるんですよ。本格的なのが。

Bitwig Studio 2.2: Bitwig Studio 2.2

Renoise 3.1: Renoise 3.1

Tracktion Waveform8: Waveform8

これ全部Ubuntu 17.04のデスクトップで動いている最先端の商用DAWです(Renoiseはtrackerというべきか…?)。

DAWの多くはVSTをサポートしているのですが、VSTWindowsMacにしか存在しないので、クロスプラットフォームにしても無駄です。Linuxでは代わりにDSSIとかLADSPA、Lv2 (LADSPA v2)が使われますが、独自のエコシステムになっています。…と言われて納得しそうになったでしょう?

VSTは今やフリーソフトウェアなんです。GPLv3で公開されているんです。 https://github.com/steinbergmedia/vst3sdk

一方でVSTクロスプラットフォームで開発するには、JUCEなどに頼りながらC++で行うのが一般的でしょう。これがC#で出来るようになったら開発が捗ると思いませんか? アレ? あんま思わねーな…まあでもUnityで作りたい、みたいな話は、定期的にForumに上がってくるみたいですね。

例によってVST.NETのようなプロジェクトはWindows onlyなので、クロスプラットフォームで実現できるような基盤がほしいところです。vst3sdkのC# wrapperがほしいところですが、それ以前にVST3で生成したオーディオストリームを再生する手段も無いのでは、何を作っても足元がおぼつかないことになります。

というわけで、まずはクロスプラットフォームのオーディオI/O APIから作っていきましょう。

クロスプラットフォームオーディオAPIの構築方法

クロスプラットフォームAPIを構築する方法はごく大まかに分けて2種類の方法があります:

前者は全体的な作業量が多くなりますが、もしプラットフォーム ネイティブAPIを低レベルで呼び出す必要が生じた場合には有利な選択肢です。また、通常はネイティブAPIのライブラリを自前で提供する必要がないので、マネージドライブラリのみを配布すれば良い可能性が高いです。問題は、オーディオI/OのAPIはプラットフォームごとに全然違うので、これらの違いを吸収するようなライブラリは設計も実装も難しいということです。

後者はラッパーをひとつ作成するだけで済むので手軽であり、またクロスプラットフォームAPIの設計にはそれなりの知見が集まっているものなので、高度な機能に依存することでもない限り、そこに便乗したほうが安心感があります。一方で、足りないAPIやサポートされていないプラットフォームがあった場合は、あきらめるか、ネイティブライブラリのほうに手を加える必要が生じてきます。

もっとも、これらは複合的に構築できます。一部のプラットフォームではクロスプラットフォームAPIのラッパーを使い、一部のプラットフォームではプラットフォーム固有のAPIを使用する、といった組み方も現実的でしょう(特にUWPに対応する場合)。

いずれの場合も、ネイティブライブラリを呼び出すにあたっては、そもそもC#のP/Invokeで対応できるライブラリであることが求められ、対応できないものは切り捨てるしかありません。C++のライブラリであれば、CのラッパーAPIを自前で用意するか(作業量が増える)、CppSharpなどのフレームワークに依存する(中間レイヤーが増え、さらに対応可能範囲が狭まる)というややこしい対応が必要になります。(ここでmanaged C++とかC++/CLIを持ち出すと、クロスプラットフォーム対応とは何だったのか…という話になってしまうので割愛します。)

C/C++クロスプラットフォーム オーディオAPIの選択肢

C/C++クロスプラットフォーム オーディオAPIは、多くはありませんが複数存在しています。

  • portaudio: Cで実装されたクロスプラットフォーム オーディオAPIで歴史が古いものはportaudioでしょう。Audacityで使われており、デスクトップ プラットフォームとしてはWindwos, Mac, Linuxで動作します。やや歴史が古いので、OSS (open sound system)などもカバーしています。
  • SDL: ゲーム開発用のライブラリで、主にグラフィックス用だと思うのですが、オーディオAPIも含まれていて、対象プラットフォームは幅広いので、クロスプラットフォーム オーディオの話題でもしばしば登場します。
  • OpenAL: 3Dオーディオ用のAPIです。一般的なオーディオI/OのAPIというわけではないのですが、Android/iOSも含め、守備範囲が広いので、クロスプラットフォーム オーディオAPIの選択肢としてよく挙がってきます。最近だとkotlinconf-spinnerでも使われていましたね。
  • RtAudio: STK (the synthesis toolkit)で使われているライブラリです。RtMidiも含めSSM (single source module)なのが特徴でしょうか(オーディオとは関係ない話ですが)。
  • JUCE: ROLIを中心に開発されており、VST開発で特に重宝されているライブラリです。

いくつかはthe horror of audio outputというblog postに詳しく悪口が書かれている(!)ので、読みたい人は参考にしてもいいかもしれません。3年前なのでいささか情報が古いですが、どのライブラリも古いのでそれなりに今でも当てはまることでしょう…

libsoundio

これらに比べると、libsoundioは比較的新しいライブラリです。libsoundioのサイトでは、portaudioやRtAudio、JUCEなどとの比較を載せています。Windowsではwasapi、MacではCoreAudio、Linuxではjack、ALSA、pulseaudioと、必要最小限のバックエンドをサポートしています。多様なチャネル形態のサポートと、オーディオデバイスの接続イベントなどが取得できるのが、モダンなところでしょうか。

libsoundioのサイトが比較ページで毎回のように挙げている「短所」は、ASIOに対応していないことです。libsoundioのページでは、ASIOよりwasapiのほうが優れているからサポートしないんだ、ということを明言しており、実際にそのような意見が他でも見られます。…と、それだけなら単純なのですが、ASIOが無いと商用サウンドカードの多くが困る、みたいなissueもあったりして、この辺は今後もどうなるか分からないところです。(作者はLinuxで生きているようなので正直どうでもいいのだろうと思います。わたしもLinuxで生きているので正直どうでもいいです…)

もうひとつのlibsoundioの欠点は…というか、ほぼ全てのクロスプラットフォーム オーディオAPIについて言えるのことなのですが…モバイル プラットフォームのサポートがほぼ存在していないことです。iOSはCoreAudioなのでもしかしたらビルドするかもしれませんが、AndroidはOpenSLESやAAudioを使うことになるので、実装は全く存在していません。

libsoundioのさらにもうひとつの懸念点は、開発者の主要なプロジェクトがzig-langであって、libsoundioやその利用事例である自作DAWではなくなっていそうだということでしょうか…。まあいったん作ってしまえばしばらく寝かせておける類のライブラリではあります。

libsoundio-sharpの実装

そういうわけで(?)、今回はlibsoundioのC#バインディングlibsoundio-sharpを作ることにしました。

github.com

ちなみに以前にportaudio-sharpというプロジェクトも作っているのですが、実用例が何一つ無いままに放り投げている状態です(!)。今回は応用事例まで作れるといいなあ…(時間切れで出来ませんでした)

P/Invokeレイヤーの完全自動生成

libsoundioはpure C APIです。これはC#を含む他言語から非常にバインドしやすいものになっていると言えます。のはずなのですが…少々トリッキーなことをやることにはなりました。

C APIの呼び出しなので、libsoundioに手を加えること無く、P/Invokeだけで全て実現しました。さらに、libsoundio-sharpでは、P/Invoke部分は、自作のclangバインディングnclangを利用して完全自動生成しています。もちろん、完全自動生成するために、nclangのサンプルとして作り置きしてあった自動生成ツールPInvokeGenerator.exeには、いくつか手を加えました。PInvokeGeneratorを利用したのは今回が初めてではありませんが、これまでは生成後のファイルに手作業でいろいろ修正を加えて利用していました。今回は生成後のファイルを無修正で使用しています。

ひとつ明確にしておきたいことがありますが、ネイティブライブラリのC#バインディングの作成というのは、C APIのP/Invokeだけ定義すれば終わり、ということにはなりません。それならCでコーディングしているほうがマシです。実のところPInvokeGeneratorでは、P/Invokeメソッドを含むクラスはinternalで定義されます。生成された(C APIをうまいこと包摂した)C#らしいAPIを定義して、初めて実用的なバインディングAPIが出来ると考えるべきでしょう。

さて、P/Invokeレイヤーを完全自動化なんて出来るんでしょうか? 以降は実現を妨げそうなメソッド定義を各論的に取り上げていきます。

refになる引数、outになる引数

libsoundioの出力ストリームへの書き出しを行う関数は、次のように定義されています:

int soundio_outstream_begin_write (
    struct SoundIoOutStream *outstream,
    struct SoundIoChannelArea **areas,
    int *frame_count)

areasは処理結果を格納するポインタへのポインタで、frame_countは入力値が参照され、かつ値が代入されて返される、C#でいうところのrefで修飾された引数です。areasのポインタの示す先には、SoundIoChannelArea構造体が(ここでは定義が見えない)「チャネル数」の分だけ含まれています(毎回メモリ確保されるのではなく、デバイス情報を格納した固定アドレスが返ってくるのだと思います)。Cでは割とよくあるスタイルのAPIですね。類似のパターンとしては、新しいオブジェクトを生成する関数が、引数で渡されたポインタへのポインタに、新しく生成されたオブジェクトを格納したりすることがありますね(戻り値はエラーコードに使われたりとか。int foobarlib_create_foo(Foo** result)みたいな感じで)。

PInvokeGeneratorはこれらをIntPtrにマッピングします:

internal static extern int soundio_outstream_begin_write(
    IntPtr outstream, IntPtr areas, IntPtr frame_count);

こんなAPIで大丈夫か? ちゃんと使えるのでしょうか? 使っている部分を見てみましょう:

public WriteResults BeginWrite (ref int frameCount)
{
    IntPtr ptrs = default (IntPtr);
    int nativeFrameCount = frameCount;
    unsafe {
        var frameCountPtr = &nativeFrameCount;
        var ptrptr = &ptrs;
        var ret = (SoundIoError)Natives.soundio_outstream_begin_write (
            handle, (IntPtr) ptrptr, (IntPtr) frameCountPtr);
        frameCount = *frameCountPtr;
        if (ret != SoundIoError.SoundIoErrorNone)
            throw new SoundIOException (ret);
        return new WriteResults (ptrs, Layout.ChannelCount, frameCount);
    }
}

soundio_outstream_begin_write()の呼び出しで渡されている2番目の引数には、IntPtr型の変数ptrsのアドレス&ptrsを保持しているptrptrが渡されています。ptrptrの型はIntPtr*です。2番目の引数はIntPtrなので、IntPtrにキャストします。3番目の引数には、frameCountを格納したnativeFrameCountというint変数へのアドレスframeCountPtrを渡しています。frameCountPtrの型はint*なので、これもメソッド定義に合うようIntPtrにキャストします。 &* などの演算子を使えれば何とかなりそうです。

呼び出し後は、frameCountPtrの値をポインタの参照先から取り出します(*frameCountPtr)。ptrptrのほうはもう少しややこしいのですが、これはパフォーマンスを考慮してWriteResultsという独自の構造体で処理しています。この構造体の中ではSoundIOChannelAreaという構造体を取得するGetArea(int channel)というメソッドがあり、これは、(non-publicな)SoundIoChannelArea構造体へのポインタのみを含む、(publicな)SoundIOChannelArea構造体を生成して返します。当初はクラスだったのですが、頻繁に生成して返すことがわかった時点で構造体にしました。

もちろん、C#でrefやoutを使えば、こんなことをする必要はありません。しかしP/Invokeメソッドを全て定期的に自動生成したい場合は、この手法が便利です。自動生成ツールは、どの関数のどの引数がref/outを使うのか判断することが出来ません。swigみたいにマッピング定義ファイルに基づいて行うのも良いでしょうが、それでは手軽さが失われてしまいます。とりあえず今回はマッピング加工無しでどこまでいけるかという実験としました。

構造体へのポインタからメンバーの値を取り出す

P/Invokeと切っても切り離せないMarshalクラスには、ポインタと文字列や構造体の間でマッピングやらマネージド型の生成やらを行うメソッドが数多く含まれています。Marshal.PtrToStructure<T>()Marshal.PtrToStringAnsi()などが典型的な例でしょう。

Marshalクラス、P/Invokeに必要そうな機能はたいてい揃っているように見えるのですが、構造体へのポインタからその構造体メンバーの値を設定するのは容易ではありません:

// C
struct SoundIoChannelArea {
    void *ptr;
    int count;
}

// C#
struct SoundIoChannelArea {
    public IntPtr ptr;
    public int count;
}

struct SoundIOChannelArea {
    IntPtr handle; // SoundIoChannelArea*
}

SoundIOChannelAreaオブジェクトに、Cコードのcountをget/setするCountプロパティを定義するにはどうすればよいでしょうか?

getterは実のところ簡単です:

get { return Marshal.PtrToStructure<SoundIoChannelArea> (handle).count; }

PtrToStructure<T>()でポインタから構造体に変換するだけです。(ただし、(後述しますが)このメソッドの利用はお勧めしません。)

setterはそうはいきません。PtrToStructure<T>()で取得したメモリは、マネージドコードで処理しても呼び出し元に影響を与えないコピーです。コピーの値を変更してもオリジナルには反映されないので意味がないですね。こういう場合には、Marshal.WriteXxx()を使います:

public IntPtr Pointer {
    get { return Marshal.ReadIntPtr (handle, ptr_offset); }
    set { Marshal.WriteIntPtr (handle, ptr_offset, value); }
}
static readonly int ptr_offset = (int) Marshal.OffsetOf<SoundIoChannelArea> ("ptr");

Marshal.OffsetOf<T>(handle)というメソッドで、C#構造体のメンバーのポインタからのオフセットを取得できます。WriteIntPtr()ではこれを利用します。

構造体に含まれる構造体へのポインタを取得する

応用問題として、構造体の中に構造体が(ポインタではなくそのまま)入っている場合があります:

struct SoundIoOutStream // soundio.h (497, 8)
{
    public IntPtr device;
    public SoundIoFormat format;
    public int sample_rate;
    public SoundIoChannelLayout layout;
    ...
}

SoundIoOutStreamをラップするSoundIOOutStreamクラスから、layoutフィールドの値…としてSoundIoChannelLayoutをラップするSoundIOChannelLayoutを返す方法は、自明ではありません。SoundIOChannelLayoutを返すには、SoundIoChannelLayoutのポインタが必要になりますが、Marshal.PtrToStructure<T>()SoundIoOutStreamの構造体のコピーを取得してしまうと、SoundIoChannelLayoutは(いくらオフセットを持っていても)このコピーの中のメモリにしかアクセスできないので意味がありません。

PtrToStructure<T>()がさらにいただけないのは、コレ、必ず引数をboxingするんですよね。boxing不要なメソッドシグネチャの意味とは…(ひとつ考えられる理由としては、P/Invokeではジェネリクスが使えないのでこうなってしまったのだろうと思います。internal callでも制約は同じなのでしょう。)

ともあれ、こういうときは、親はポインタのまま、オブジェクトのハンドルにメンバーのoffsetを加算すれば、子もポインタのまま取得できます:

public SoundIOChannelLayout Layout {
    get { return new SoundIOChannelLayout (handle, layout_offset); }
}
static readonly int layout_offset = (int) Marshal.OffsetOf<SoundIoOutStream> ("layout");

構造体内部にある構造体を値として外部から設定する

上記の類似問題として、今度は値を取得ではなく設定する場合はどうでしょうか。

public SoundIOChannelLayout Layout {
    set { Marshal.WriteOMGWHATDOINEEDHERE<SoundIoOutStream> (handle,  layout_offset, valueOMGWHATSHOULDIDOHERE); }
}
static readonly int layout_offset = (int) Marshal.OffsetOf<SoundIoOutStream> ("layout");

任意の構造体を読み書きできるようなメソッドはMarshalクラスには無いんですね。こういう時はBuffer.MemoryCopy()を使うとよいでしょう:

unsafe {
    Buffer.MemoryCopy ((void*)((IntPtr)handle + layout_offset), (void*)value.Handle,
               Marshal.SizeOf<SoundIoChannelLayout> (), Marshal.SizeOf<SoundIoChannelLayout> ());
}

corefxではBuffer.MemoryCopy()みたいな古いAPIでも今年になって最適化が図られていたりするので、monoもこっちベースにならんかなあとか思うわけですが、とりあえず今のところはreferencesourceベースのようです。まあでもそれなりの速度は出るでしょう。

あとcorefxにはSystem.Runtime.CompilerServices.Unsafeというクラスが追加されていて、ReadWriteReadUnalignedWriteUnalignedなど便利そうなやつを持っているので、これを使うという手もありそうです。ilasmのソースで実装されていてP/Invokeやinternal callはしていなさそうなので、多分monoでも使えるのではないかと思いますが(古いUnityとか無理そう)、今回は依存しないことにしました。

C#配列にIntPtrからデータをコピーする

SoundIOInStreamのread callbackから取得したデータはIntPtrでチャネルごとに格納されてきますが、これをたとえばSystem.IO APIを使ってファイルに保存したい場合は、byte配列などに格納してやらなければならなくなります。これはちょっと面倒ですね。

Marshal.UnsafeAddressOfPinnedArrayElement()を使ってポインタにしてしまえば、Buffer.MemoryCopy()が使えるのですが、いったんpinned objectにしないといけないはずなので、このメソッドにそのまま渡すだけではダメでしょう。こういうときは単に配列にfixedを使うとよいでしょう(使えます):

var arr = new byte [capacity];
unsafe {
    fixed (void* arrptr = arr) {
        int fill_bytes = ring_buffer.FillCount;
        IntPtr read_buf = ring_buffer.ReadPointer;
        Buffer.MemoryCopy ((void*)read_buf, arrptr, fill_bytes, fill_bytes);

その他のP/Invokeトラブルシューティング

  • memset()でゼロ化する方法が無い。
    • これはmonoランタイム限定の裏技ですが、kernel32 APIのCopyMemory, FillMemory, MoveMemory, ZeroMemoryに限って言えば、kernel32.dllを(擬似的に)DllImportすることで、これらに相当するmonoランタイム内にある代替実装が機能するかもしれません。mono/data/config.inを参照。あるいはdll.configではplatformによる条件指定や名前の再マッピングもできるようになっているので、必要だったらそれらを駆使すればいけます(と断言していますが未検証)。
    • Unsafeの中にInitBlock()なるメソッドがあるのを発見しました。CILのinitblock命令を呼び出すだけに近い、かなりシンプルな内容ですが、目的はこれで果たせそうです。

monoと.NET Coreの同時サポート

今回のlibsoundio-sharpは、.NET Coreプロジェクトとしてもビルドできます。実体は極めてシンプルで、ライブラリ用の.csprojとNUnitテスト用の.csprojの2ファイルが存在するだけです。どちらも、"SDK"を指定する新しい方式の.csprojで、ソースファイルは(サブディレクトリには無いので自動化はできず)ワイルドカードで指定しているだけです。これだけなら5分もあれば.NET Core対応できますね。サンプルは対応していませんが…まあ5分もあればできるんじゃないですか? 誰にでも。

テストには NUnit3TestAdapter を使っています。dotnet test のみでビルド・実行できるようになっています。最初はxunitで独自にテストを書いてdotnet xunitで実行していたのですが、NUnitと両方メンテするのはバカバカしいのですぐに止めました。いったん2つの*.csprojを作成した後は、無変更でテストできています。

ちなみに「monoと…」と書いていますが、.NET Framework + Windowsでも当然使えるはずです(動作確認はしていないけど、.NET Coreでは動いているし…)。

System.IntPtrPointer<T>の使い分け

PInvokeGeneratorは、JNAやBridJなどでもよく使われる「ポインタを表現する型」としてPointer<T>という型を追加するのですが(ちなみに全部生成します。「ランタイム」を作りたくないので)、これはDllImportされるメソッドの定義などでは使われていません。.NET (Framework / Core) のP/Invokeジェネリック型を受け付けないんですね。monoランタイムの環境だと通ったりするので、.NET Coreで動かしてみて初めて気づいたりしました。

実用上はimplicit演算子の実装を追加しているので、あまり気にする場面は無いと思います。

Pointer<T>みたいな基本的な型を定義してP/Invokeで使えない、というのは、C#の重大な欠点のひとつだと思います。Kotlin/Nativeのcinteropを見てみましょうCPointer<T>CValuesRef<T>CValue<T>など、ジェネリクスが過剰な制限に足を引っ張られること無くふんだんに活用されています。

C# 7.2は値型をある程度柔軟に扱えるようになりましたが、この辺りにはまだまだ他の言語を見習って改善する余地がありますね。

次の課題

PInvokeGeneratorでC#のコードは自動生成できて楽になった(?)のですが、サウンド関連のコードは前述のvst3sdkも含め、けっこうC++のものが多いんですよね…というわけで、今度はC++APIから一旦CのAPIを自動生成して、それをP/Invokeできるような仕組みを考えています。CppSharpで出来そうな領域ですが、CppSharpがなかなか安定してLinux上でビルドできない/動作しないので自分で作りそうです(nclangともだいぶ役割がかぶっている)。まあ何かしら成果が出たら公開すると思います。

以上で7日目の分はおしまいです。明日は増田さん @moonmile のターンです(なにこのXamarinシーケンス)。よろしくお願いします。

Extensive Xamarin @ 技術書典3

こちらではだいぶギリギリの告知となってしまいましたが、10/22(日)の技術書典3で、Xamarin周辺コミュニティの何人かの方と一緒に、Xamaritansの名前で(これいつまで使うんだろ)同人誌の新刊を出します。

techbookfest.org

サークル配置番号は「お-13」、新刊は1000円で頒布する予定です。当日頒布分については、電子版のダウンロードカードもお渡しする予定です。(問題なく作業する余裕があれば…)

書名は"Extensive Xamarin"としました。書籍紹介に、まえがきのために書いたポエムをコピペってあるのですが、前作"Essential Xamarin"とはだいぶ方向性が変わって、実践的な各論を中心として、Xamarinの基本を押さえた「その先にあるもの」がたくさん集まっている1冊になっています。記事の難易度も、入門的でわかりやすいものから難解で読み応えのあるものまで、幅広く集まったと思います。

内容の詳細、プレビューが、新刊情報の公式ページで公開されているので、そちらも見てやってください。

当日は既刊"Essential Xamarin"の同人誌版も販売する予定です。

前回"Essential Xamarin"を新刊として出した技術書典2の頃は、Xamarinの新鮮な情報がほぼ書籍として存在していない状況で、各メンバーが本気で最新情報を大量に盛り込んで来た結果、印刷の都合もあって2冊に分けるほどになり、商業化されて達人出版会などでも販売されるようになりましたが、Xamarin本はここ半年くらいで基本書の類がかなり充実してきました。なので、技術書典3では商業化を目標とするのではなく、もう少し本来の「同人誌らしい」「ポピュラーなニーズを気にせず」「書きたいことを書ける」ものにしたいなあという気持ちがそこそこありました。執筆メンバーが締切を前にのびのびと書けたかはわかりませんが(!?)、結果的に集まってきた原稿を見ていて、概ね目的は達成できたかなと思っています。

ちなみに今回は裏表紙までイラストを描いていただいていたりします。贅沢仕様! (この元ネタが分かる人はほとんどいないと思いますが…)

f:id:atsushieno:20171019120618p:plain:w300:h250

10/22当日ですが、わたしは技術書典本体のスタッフとして行動しているので、残念ながら来てくださる方とお話しする余裕は多分無いんじゃないかと思いますが、サークルのブースでは他の執筆メンバーにお手伝いしていただくことになっています。今回は4Fに休憩スペースも設けてあり、整理券でいつでも再入場可能なので、ひと通り見終わったらそちらに移動して戦利品の見せ合いなどしてもらえればと思います。

今回は技術書典3本体の準備も割と忙しく、周りの何人かの方にお手伝いをお願いしたり、自分のサークル側の作業もだいぶ滞ったりと、なかなかタフな状況なのですが、当日まで何とかやっていきたいと思いますんで、みなさん技術書典3にぜひ遊びに来てやってください。

iOSDC2017に参加してきた

オマエiOSやらないじゃん?というかそもそもモバイルアプリケーションを開発するやつじゃないじゃん?という感じだけど、iOS開発ツールやObjC/Swiftについては調べたり書いたりすることもあるし(今は技術書典3向けの原稿に書くためにいろいろ調べるフェーズ)、AndroidコミュニティはけっこうわかってきたけどiOSコミュニティはほとんど知らないので、飛び込んでいろいろ教えを請うべきだろうと思って参加してみた。

 

iosdc.jp

Ubuntu使いのAndroid使いのアプリケーション開発しないわたしはあらゆる意味でアウェイだったのだけど(あ、それ.NETクラスタでもそうですかね…)、面白いセッションがたくさんあったしLTもうまいのがたくさんあったし、次回もぜひとも参加したいと思えるいいカンファレンスだった。個人的にはなぜか台湾から来ていたグループとランチしていたり(わたしがセッションやったMOPCON2014のTシャツで来ているのがいて声をかけずにはいられなかった。あと残りはKKBoxの面々だったけど、昔なぜか台北に住んでいた時にCEOのChrisの接待トークをやらされたことが…)、懇親会で中国人クラスタと話し込んだりしていて、あんまりiOS感があったわけでもなかったけど、それはそれでいいんじゃなかろうか。何の業だろうな。

 

今回はいろいろ調べて面白かったAutoLayoutの話を書きたい。1日目のキーノート的なセッションだ。

speakerdeck.com

AutoLayoutを実装しているレイアウトエンジンのアルゴリズムについての解説で、内容はAutoLayoutの制約ベースのレイアウトを実現しているCassowaryというアルゴリズムの説明だった。前段から数式だらけだった(そのうちtwitterのiOSDCまとめとか出来るんだろうと思うけど、「あーそういうことね完全に理解した」(画像略)の流れである)のだけど、それは制約ベースのレイアウトというのが本質的に線形計画問題となるからだ。ということだ。

詳しくはセッション資料にわかりやすくまとめられているけど、AutoLayoutは、複数の「制約」を(優先度を考慮しつつ)最大限満たすレイアウトを自動計算するもので、これは線形計画問題として捉えることができる。線形計画法は日本の最初のソフトウェア特許訴訟(カーマーカー特許)というかたちで知財クラスタにはよく知られている。コンピューターの計算量を最大限に活用して数学の問題を解決する技術だ。今回のセッションでは「複雑な計算をしている(だから計算力のあるマシンが求められる)」という反応がよく見られたが、線形計画問題を高い計算力で解決するというのは伝統的なソフトウェア技術の応用だ。

Cassowaryアルゴリズムというのは、レイアウト問題を線形計画問題の応用として解決する解法と考えれば良さそうだ。そして、レイアウトの問題は特定のGUIシステムに固有のものではないので、さまざまな言語・環境向けのCassowaryの実装が存在しているようだ。AndroidにもConstraintLayoutがあるけど、これもCassowaryの実装だそうだ。

www.bignerdranch.com

もっとびっくりしたのは、Gtkにすら存在していて、それがDiaCanvasが使われていた頃から存在していた、ということだ。2001年なんてもしかしてみんな生まれていないんじゃないの…

sourceforge.net

ちなみにGtk向けにはもうちょっとモダンなやつがあるようだ。

github.com

以前から「AutoLayoutもConstraintLayoutもなんか似ているっぽいしクロスプラットフォームでそれっぽいものを実現できるんじゃないの」と思っていたのだけど、どちらもアイディアが同じアルゴリズムで(先にリンクしたページにあるように)実装の違いはあっても(VisualFormatはAutoLayoutだけのDSLだろう)、レイアウトエンジンが共通化できるというのは夢のある話だ。たとえば、Cで共通コードを書いておいて、それをXamarin.Formsにダイレクトに適用できるということだ。

twitterでは何度か言及しているのだけど、XamarinではCSSのFlexBoxのモデルをCで実装したコードが開発されている。コミットログを見れば分かるけどRubyMotionハカー(lrz)がうちに入ってきてから主に作っていたプロジェクトだ。

github.comFacebookにもyogaというプロジェクトがあって、そっちのほうが有名だと思うけど、Cでレイアウトエンジンを実装しておいて、それを全方面で活用するというやり方は、今後もいくつか出てくるかもしれない。Cassowaryも完全に同じ流れでいけるような気がする。P/Invokeで呼び出すプラットフォーム中立なライブラリを作ってから、それをFormsのレイアウトシステムに合わせるのが楽そうだ。

…とまあ、こういう思索がいろいろ出来た刺激的なセッションだった。わたしはGUIより他にやりたいことがありすぎてこっちまでやる時間は無いと思うので、GUIを作り込むのが好きな人がいたらおひとつどうですかね?

 

追記: 更にいろいろあることを教えていただいた:

 QtもAngularもある…! すごい。

D8コンパイラをXamarin.Android(d15-5以降)で使う

今からだいたい1ヶ月前に、Googleが新しいDexコンパイラd8を紹介していました。

android-developers.googleblog.com

d8Android SDKの既存のツールで言えばdxに相当する機能を実装しています。dxはJava bytecode (*.class)をDalvik bytecode (*.dex)に変換するコンパイラですね。通常はclasses.dexをビルドするために使われています(が、大抵の人は意識していないでしょう)。

Android Studio 3.0のbetaでは既にこのd8を有効に出来ます。既に使えるならXamarin.Androidでも使えるようにしたいところです。ただ、リリース当初はd8のソースが見当たらず、しばらく待っていました。その後、d8がr8のリポジトリに含まれていると教えてもらったので、試しに使ってみたら上手くいきました。

というわけで、dxの代わりにr8を使うようなNuGetパッケージを作っておきました。ソース…と言うほどのものは無いのですが…はここにあります。ちなみにxamarin-androidに加えた変更もかなり小さいものです。

github.com

xamarin-android-d8-build をpackages.config に追加するとインストールできます(このパッケージはまだリスティングに載せていないので、パッケージマネージャのUIで検索しても出てきません)。パッケージをインストールするだけでMSBuildプロパティが追加されるだけで、Xamarin.Androidアプリケーション以外で副作用は無いはずです。

このパッケージですが、実のところXamarin.Androidを製品版から使用している人には使えません。xamarin-androidをmasterからビルドしている人は今すぐ使えます。そうでない人はd15-5ブランチがalpha channelに降ってきてから利用できるようになります。ちなみに今はd15-3がstable、d15-4がalphaですね。

これ自体は大したコードの変更を伴っていないのに、なぜこんな根本的な差し替えが可能なのでしょうか? それは、Xamarin.AndroidMSBuildタスクを読み解くことが出来れば誰にでも出来ます(MSBuildタスクはデバッグビルドのサポート固有の部分以外はgithubで公開されています)。dx.jarを呼び出す部分はCompileToDalvikターゲットであり、CompileToDalvikタスクでコマンドラインを生成しています。ここではdx.jarはDxJarPathプロパティ、その引数はDxExtraArgumentsプロパティで指定されています。

今回のNuGetパッケージはこれらのプロパティをオーバーライドして、同梱のr8.jarを使用するように指定しているだけです。ちなみにdx.jarを使う場合は--dex--no-strictというオプションが必要なので、これらはDxExtraArgumentsのデフォルト値となっています。r8を既存のCompileToDalvikタスクで使うにはこれらが邪魔だったので、消す作業をした、というわけです。

DxJarPathはもともとカスタマイズ可能になっていたので、全体的な変更も些少なものです。

…というわけで、ごく簡単なハックですが、MSBuildタスクをどうやってカスタマイズすればいいか、簡単に解説できるネタだったのでまとめてみました。

Essential Xamarinが"技術書典シリーズ"のひとつとして刊行されます

少し前にお知らせしていたことですが、われわれのXamarin同人誌「Essential Xamarin」が、9/1にインプレスR&Dさんから出版されます。

prtimes.jp

商業化したということで、販路が広がって、Kindle版も出ています*1

https://www.amazon.co.jp/dp/B07539YT44/www.amazon.co.jp

1冊になったので、この4体も当初の計画のように1枚絵になりました。

商業化に際しては、ひらのさん(@ailen0ada)によるXamarin.iOSの記事が追加されたり、最新情報に合わせたアップデートが行われたりしています。あとプロの編集さんが手を加えた原稿をgit diffで眺めましたが(編集作業のやり取りもgithub上で行っていました = 編集済みの原稿をcommitしていただいていました)、やっぱりプロの作業は違う…われわれも相互レビューしているのですが、文言レベルでより誤解を招かないようなかたちにする修正などは、経験が出ますねー。

Essential Xamarinは、軽い気持ちで執筆者を募集したら、気づいたらXamarinコミュニティのガチ勢が本気で書いた原稿だらけになって、これは商業化できるレベル…!と思っていたら、実際に商業化の流れになって、いい話になったなという感じでした。

もうひとつ面白いのは、本書は新しく「技術書典シリーズ」というコレクションの2冊めの本として出るということです*2。技術書典はもともと同人誌から技術書界隈を元気にしていこうというノリで始まったものでしたが、同人誌から目立ったものを出版社が拾い上げて商業化する流れがあって、既に何冊か出ています。

技術書典は、そういう意味では「宝の山」なわけです。当然、出展者の数も多いわけです。前回の技術書典2が190件近くあって、10月の技術書典3も会場が同じだしほぼ同数でしょう。そこから拾い上げられた書籍、というある種のクロスボーダーなシリーズということになるわけで、これが通好みのものなのか、完成度が高いものなのか(あるいは全然別の評価が妥当なのか)はわかりませんが、ひとつのブランドとして通っていくと面白いなと思います。

ちなみに、技術書典3には、この同人誌版のEssential Xamarinも売り物として持っていく予定です。同じ会場でインプレスR&Dさんがこの商業版も販売する予定なので(その案内もこちらのブースで出す予定です)、どのように売れるかは見てみたいですねー、という話を出版社の方としていました。

技術書典は、わたし自身は運営にも片足を突っ込みながらサークルも回しているという特殊事例なのですが(それで特別扱いされることは無いです)、サークルの回し方なども初心者なりに適宜広めながら技術書典3に向けて進めていこうと思います。Xamaritans(サークル)のほうは、初稿締切までは3-4週間ですが、まだ執筆者も募集しているので、参加してみたいという方がいたらお気軽にご連絡ください。名前はXamarin系ですが、Xamarinと関係ない記事も書かれる予定ですし、商業化クオリティ…!とか気負ったことは考えずに、同人誌らしいものをのびのびと書いてもらえればと思っています。

*1:まあKDPならわれわれでも出せましたが

*2:ちなみに技術書典シリーズ第1弾は最新JavaScript開発です。

安全なビルドタスクとクリーンタスクを実装するために気をつける点

ビルドシステムを使いこなすのは難しい。この場合「使いこなす」とは、Visual StudioでF5を押してビルドしたり、メニューから「クリーン」を選んで実行する、程度の内容ではなく、ビルドタスクを記述して他のユーザーに自分以外の開発環境でビルドを期待通りに動かす程度には複雑な操作を行うことである。

あるビルドが期待通りに動かない、という問題は、もう少し具体的に挙げるなら、たとえば次のような状態だ:

  1. ビルドが成功していると言われているのに、期待しているアウトプットが無い
  2. ビルドが途中でエラーを起こして終了する
  3. ビルドが完了しない
  4. ビルドが想定外のソースを元に行われて完了する
  5. ビルドが期待通りのアウトプットを生成しているにもかかわらず、失敗と表示される
  6. ビルドは一応期待通りに完了するが、時間がかかり過ぎる
  7. ビルドが期待通りにエラーを出すのだが、そのメッセージが間違っているか、意味が伝わらない

同様に、クリーンアップが期待通りに動かない問題にも、いくつかパターンがある:

  1. クリーンアップで、ビルド出力以外のファイルが削除される
  2. クリーンアップが期待通りにファイルを削除しない
  3. クリーンアップで、期待されている以上にファイルが削除され、次のビルドに時間がかかりすぎる

「ビルドが成功していると言われているのに、期待しているアウトプットが無い」典型例は、ビルド中のあるステップで失敗しているのに、それに気付かずにビルドが続行してしまう場合だ。子プロセスを実行しているなら、その結果を終了コードなどで確認する必要がある。あるいは、コマンドは実行継続中なのに、呼び出し元には処理が戻っていて、その後の処理に依存しているのに、それに気付かずに続行しているのかもしれない。

「ビルドが途中でエラーを起こして終了する」場合や「ビルドが完了しない」場合というのは、ユーザーのカスタムビルドタスクがおかしい場合もあれば、そもそもビルドエンジン(ビルドツール)がおかしい場合もある。ビルドツールもプログラムに過ぎないのだから、そのような問題は当然発生しうるわけで、これらは理解しやすい問題と言える(デバッグの難易度は別論として)。

「ビルドが想定外のソースを元に行われる」というのは、たとえば次のような場合だ:

  • 一旦ソースコードに何かしらの加工を加えた上でコンパイラに解析させるビルドの場合(AOPなどを想定すると良い)、きちんと最新のユーザーソースをもとにAOP処理が行わなれないと、古いソースがコンパイラに渡されることになりかねない、といった例がある。TypeScriptがJavaScriptに正常にコンパイルされていないのに、最後にコンパイルされた時に生成されたJavaScriptファイルをそれ以降のビルドに使って、実行時エラーを起こす、なんてこともあり得る。
  • あるいは、「クリーンアップが期待通りにファイルを削除しない」問題と組み合わさることで、不正に残されたビルドキャッシュから「クリーンなはずの」ソースをビルドしようとして、一貫性のないアウトプットが生成されることがあり得る。

「ビルドが期待通りのアウトプットを生成しているにもかかわらず、失敗と表示される」という状態は、一番分かりやすい例では子プロセスの終了コードのチェックが反転している(0をエラー扱いする)などの場合で、ビルド出力がある以上実質的な問題はないという場合もあるが、続く処理があってもそこで終了してしまうかもしれないという問題がある。

「ビルドは一応期待通りに完了するが、時間がかかり過ぎる」というのは、ビルドそのものが妨げられているとは言えないが、例えば次のような場合に問題になる:

  • ビルドキャッシュをうまく構築できていない。(キャッシュの生成に失敗している、認識できていない、普通にビルドするよりキャッシュの構築のほうが時間がかかる、など)
  • 一回構築するのに長大な時間を要するビルドタスクなのに、クリーンするたびに再実行しなければならない。100MBのダウンロードが、毎回クリーンのたびに実行されるのはまずい。

「ビルドが期待通りにエラーを出すのだが、そのメッセージが間違っているか、意味が伝わらない」というのも、ビルドそのものが妨げられているわけではないが、問題が発生した時に原因の追及が困難になる。

クリーンアップに話を切り替えよう。

そもそも、クリーンアップタスクが難しくなる要因のひとつは、「雑にビルド出力ファイルや中間出力ファイルを消せない」という点にある。ユーザーがデバッグに必要なファイルをとりあえずbinディレクトリにコピーして置いておくのだけど、安易に消してほしくない、ということがあるかもしれない。まともなMSBuildカスタムビルドタスクがbinディレクトリをまるっと削除することが無いのは、そういう理由による。ここをガン無視すれば「クリーンアップで、ビルド出力以外のファイルが削除される」という問題は生じるものの、想定されていない再ビルド結果には、ならなくなる。

「クリーンアップが期待通りにファイルを削除しない」というのは、ビルドタスクの作業を追加して 中間ファイルが新しく増えたことを忘れている、というのがよくある要因だろう。また、そもそもビルドタスクの中で外部ツールを呼んでファイルを生成していたりすると、呼び出すタスクを実装している側も、その外部ツールの実行結果なんて把握していられないこともあり、そうなると一貫しない結果が生じる余地が大きくなる。

「クリーンアップで、期待されている以上にファイルが削除され、次のビルドに時間がかかりすぎる」というのは、たとえばクリーンビルド時にMavenやNuGetの依存ライブラリを毎回ダウンロードしてローカルにキャッシュする作業が毎回発生してはならない、ということである。完全に「クリーン」なビルドがきちんと実現できるのは一番安全ではあるが、毎回ダウンロードまで完了しなければクリーンビルドが出来ないというのは、やりすぎである。

この問題の亜種で、「クリーンアップで消してはならないファイルを消してしまって、それなのに間違ったビルド初期化キャッシュ情報が残っている結果、初回ビルドの時に行ったダウンロードと初期化の処理は行われず、結果的に以降のビルドが失敗する」という例もあると思われる。

…とまあ、いろいろな事情が考えられる。いずれにしろ、ビルドタスクが想定通りに動かない問題に遭遇したら、こんな感じで列挙した問題のいずれかにひっかかっていることもあると思うので、参考になることがあれば参考にされたい。

技術書典3向けXamarin同人誌の執筆者を募集します

あの技術書典が今秋にも行われることになりました。

techbookfest.org

そういうわけで、技術書典2の時と同様に、サークル参加してみようと思います。前回はおっかなびっくりいろいろ手探り状態で進めていたわけですが(それでもTechBoosterなどを見ていたのでいろいろやりやすかったはず)、今回は進めやすいかなと思っています。

募集といっても雑なものなので、前回の募集要項振り返りをもとに、書きたいという方がいらっしゃったら、以下のgithubリポジトリのissueで参加表明などしていただければと思います。

github.com

前回募集していた時はそこまで意識していなかったのですが、前回は結果的にXamarin関係の執筆者としてはかなりの強者が集まっていて、商業クオリティの本どころか現時点で最強クラスのXamarin関係書籍が2冊分も出来て実際に商業化の作業も進んでいるわけですが、わたしとしてはあくまで同人誌として「みんなが書きたいことを気軽に書ける」ことを目標にしたいと思っています。もちろん、ガチガチのクオリティで書いてほしくない、ということは無くて、最強の原稿を書き上げていただければ、可能な範囲で適宜アレンジします。

同人誌を出すサークルを回すための知見もいろいろ共有しているつもりなので、執筆しながらその辺も見ておきたいという人も気軽に参加してもらえればと思っています。

誰もいなければわたしが1人で適当に何か書いて出します(まあそんなことにはならないと思いますが)。