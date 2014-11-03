興味深いバイトコードのコンストラクタ

命令コードは総体的に簡潔ですが、次の処理を経ているために奇妙に見えるものもいくつかあります。

コンパイラの最適化

インタープリタの最適化（これにより余分な命令コードが生じる）

シーケンスを用いた変数への代入

最初のカテゴリでは、ソースが変数のシーケンスを代入するとどうなるかを見ていきます。

(1) a, b = 1, '2'

(2) a, b = 1, e

(3) a, b, c = 1, 2, e

(4) a, b, c, d = 1, 2, 3, e

上記の4つのステートメントは全く異なるバイトコードを生成します。

最初のステートメントは、右辺（RHS）に代入された値が定数のみなので最も単純なケースです。この場合、CPythonはUNPACK_SEQUENCEを用いてタプル(1, '2')を作成し、2つの要素をスタックに設定して、変数aとbのそれぞれについてSTORE_FASTを作成することができます。

0 LOAD_CONST 5 ((1, '2'))

3 UNPACK_SEQUENCE 2

6 STORE_FAST 0 (a)

9 STORE_FAST 1 (b)

ところが、2番めのステートメントでは、右辺に変数があるため、ジェネリック型のケースが呼び出され、そこで式が取り出されます。（ここではLOAD_GLOBALを使用した単純な式）。コンパイラではスタック上の値（インデックス18）から新しいタプルを作成する必要はなく、UNPACK_SEQUENCEを使用します。スタックの一番上の2つの要素を入れ替えるROT_TWOを呼び出すにはこれで十分です（19と22を入れ替えても十分だったかもしれません）。

12 LOAD_CONST 1 (1)

15 LOAD_GLOBAL 0 (e)

18 ROT_TWO

19 STORE_FAST 0 (a)

22 STORE_FAST 1 (b)

3番目のケースは実に不思議です。スタックに式を入れるメカニズムは前のケースと同じですが、この場合は一番上の3つの要素を入れ替えた後、さらに一番上の2つの要素を入れ替えます。

25 LOAD_CONST 1 (1)

28 LOAD_CONST 3 (2)

31 LOAD_GLOBAL 0 (e)

34 ROT_THREE

35 ROT_TWO

36 STORE_FAST 0 (a)

39 STORE_FAST 1 (b)

42 STORE_FAST 2 (c)

4番目のケースはジェネリック型のケースを表し、ROT_*を使った処理はこれ以上できないらしく、タプルを作成し、UNPACK_SEQUENCEの呼び出しでタプルをスタックに追加しています。

45 LOAD_CONST 1 (1)

48 LOAD_CONST 3 (2)

51 LOAD_CONST 4 (3)

54 LOAD_GLOBAL 0 (e)

57 BUILD_TUPLE 4

60 UNPACK_SEQUENCE 4

63 STORE_FAST 0 (a)

66 STORE_FAST 1 (b)

69 STORE_FAST 2 (c)

72 STORE_FAST 3 (d)

callコンストラクタ

最後にご紹介する興味深い例は、callコンストラクタと呼び出しを作成する4種類の命令コードに関するものです。この命令コードの数は、インタープリタのコードを最適化するために想定しました。なぜなら、Javaのようにinvokedynamic、invokeinterface、invokespecial、invokestatic、invokevirtualのいずれか1つがあれば意味を成すというわけにはいかないからです。

Javaのinvokeinterface、invokespecial、invokevirtualは言語の静的型付けから派生しています（またinvokespecialはコンストラクタとスーパークラスAFAIKの呼び出しのみに使用されます）。invokestaticは自己記述型（スタックにレシーバを追加する必要がない型）ですが 、Pythonにはそのような概念がありません（インタープリタで処理し、デコレータを使用しない）。つまり、Pythonで呼び出すとしたら、必ずinvokedynamicで翻訳されることになります。

ここではPythonのさまざまなCALL_*命令コードは取り上げていません。なぜなら型付けや静的メソッドがあったり、コンストラクタ用の特殊なアクセスが必要なためです。これらはすべてPythonのメソッド呼び出しの指定方法を対象にしています。文法は次のとおりです。

Call(expr func, expr* args, keyword* keywords,

expr? starargs, expr? kwargs)

calls構造体のコードは次のように記述できます。

func(arg1, arg2, keyword=SOME_VALUE, *unpack_list, **unpack_dict)

キーワード引数はパラメータを位置だけではなく、名前指定で渡すことができます。*はイテラブルからのすべての要素を引数（タプルではなくインライン）として指定し、**はキーワードと値の辞書を想定します。

次の例ではcall siteコンストラクタの可能なすべての機能を実際に使用しています。

変数の引数リストを渡す(_VAR)：CALL_FUNCTION_VAR, CALL_FUNCTION_VAR_KW

キーワードベースの辞書を渡す(_KW)：CALL_FUNCTION_KW, CALL_FUNCTION_VAR_KW

バイトコードは次のようになります。

0 LOAD_NAME 0 (func)

3 LOAD_NAME 1 (arg1)

6 LOAD_NAME 2 (arg2)

9 LOAD_CONST 0 ('keyword')

12 LOAD_NAME 3 (SOME_VALUE)

15 LOAD_NAME 4 (unpack_list)

18 LOAD_NAME 5 (unpack_dict)

21 CALL_FUNCTION_VAR_KW 258

通常CALL_FUNCTIONはopargとして関数の引数の数を受けとりますが、ここではその他の情報もエンコーディングされています。1バイト目（0xffマスク）は引数の数、2バイト目（value >> 8) & 0xff）は渡されるキーワード引数の数を指定します。スタックからポップする要素の数を計算するには、次のようにして値を取得する必要があります。

na = arg & 0xff # num args

nk = (arg >> 8) & 0xff # num keywords

n_to_pop = na + 2 * nk + CALL_EXTRA_ARG_OFFSET[op]

CALL_EXTRA_ARG_OFFSETにはcall命令コード個別のオフセット（CALL_FUNCTION_VAR_KWの場合は2）が格納されます。この例では関数名にアクセスする前にポップする要素の数として6が返されています。

その他のCALL_*キーワードに関しては、コードでリスト渡しの引数と辞書渡しの引数のどちらを使用しているかによって決まります。要は組み合わせの問題です。