ストリームの作り方

本記事はストリームについて、Schemeを用いて説明しています。 サンプルコードの動作確認を行ったSchemeの処理系、バージョンは以下のとおりです。

Gauche scheme shell, version 0.9.5 [utf-8,pthreads], x86_64-apple-darwin15.6.0

ストリーム

  • データ構造の観点からすると、ただのシーケンス
  • 代入やミュータブルなデータを用いることなく、状態を保持できます
  • 遅延評価を用いることで、無限を扱えます

遅延リスト

  • 遅延リストとは構成時ではなく、選択時に実行されるリスト

上記のみだと説明不足すぎるので、一般的なシーケンスのリストの問題点から説明します。 シーケンスをリストで表現すると、状態がスタックとして積まれ続けるので、計算速度、メモリの使用量的に問題があります。

以下のコードはn番目のフィボナッチ数を求めるものです。完全にリストが作成されるまで値は求まりません。10番目のフィボナッチ数を求めるには9番目のフィボナッチ数と8番目のフィボナッチ数が求まっていなければならず、9番目のフィボナッチ数を求めるには8番目のフィボナッチ数と7番目のフィボナッチ数が求まってなければならず…

;recursive process

(define (fib-r n)
  (cond ((= n 0) 0)
        ((= n 1) 1)
        (else (+ (fib-r (- n 1))
                 (fib-r (- n 2))))))

n番目のフィボナッチ数を求めるコードをiterative processで書き直したものが以下のようになります。countを格納する場所さえ確保すればよくなりますが、シーケンスとして扱うことはできなくなります。

;iterative process

(define (fib-i n)
  (define (fib-iter a b count)
    (if (= count 0)
        b
        (fib-iter (+ a b) a (- count 1))))
  (fib-iter 1 0 n))

上のrecursive processとiterative processの両方の問題点を解決するためにストリームを用います。ストリームだと遅延評価を用いるため、リストとしてシーケンスを扱うコストを払う必要がなくなります。

まず、以下のようにcons-streamという構成子があるとします。

(cons-stream <a> <b>) 

<b>を評価するタイミングをリスト構成時ではなく、<b>を選択するタイミングに変更します。 そうすることで、上に書いたrecursive processでフィボナッチ数を計算する際の計算速度、メモリの使用量などの問題が解決されます。 以下のコードでストリームを作成します。(cons-stream <a> <b>)<b>stream-cdrでアクセスされてはじめて実行されます。

(define-syntax cons-stream
  (syntax-rules ()
    ((_ a b) (cons a (memo-proc (lambda () b))))))

(define (stream-car stream) (car stream))

(define (stream-cdr stream) (force (cdr stream)))

(define (force delayed-object)
  (delayed-object))

(define (memo-proc proc)
  (let ((already-run? #f) (result #f))
    (lambda ()
      (if (not already-run?)
          (begin (set! result (proc))
                 (set! already-run? #t)
                 result)
          result))))

ストリームの動き

では、実際にストリームの動きを見ていきましょう。まずはいくつか関数を簡単に説明をします。

  • (stream-enumerate-interval low high)はlowからhighまでの正の整数のストリームを作成しています
  • (stream-ref s n)はストリームのn番目まで取り出します
  • (stream-map proc . argstreams)はストリームにprocを適用させています
  • (display-line x)はストリームの流れを確認するために標準出力しています
(define (stream-enumerate-interval low high)
  (if (> low high)
      the-empty-stream
      (cons-stream
       low
       (stream-enumerate-interval (+ low 1) high))))

(define (stream-ref s n)
  (if (= n 0)
      (stream-car s)
      (stream-ref (stream-cdr s) (- n 1))))

(define (stream-map proc . argstreams)
  (if (stream-null? (car argstreams))
      the-empty-stream
      (cons-stream
       (apply proc (map stream-car argstreams))
       (apply stream-map
              (cons proc (map stream-cdr argstreams))))))

(define (stream-null? stream) (null? stream))

(define the-empty-stream '())

(define (display-line x)
  (display x)
  (newline))

ストリームを構成したタイミングではリストの1番目のみ評価されます。リストの残りは呼ばれるまで、実行されません。

gosh> (define x (stream-map display-line (stream-enumerate-interval 0 10)))
0
x
gosh> (stream-ref x 5)
1
2
3
4
5
#<undef>
gosh> (stream-ref x 7)
6
7
#<undef>

無限のストリーム

ストリームは無限を定義できます。フィボナッチ数列(フィボナッチ数の無限のストリーム)を定義すると、以下のようになります。 再帰で無限ループしているように見えますが、(fibgen b (+ a b))の部分は呼ばれるまでは実行されないので問題ありません。

(define (fibgen a b)
  (cons-stream a (fibgen b (+ a b))))

(define fibs (fibgen 0 1))
gosh> (stream-ref fibs 10)
55

ストリームの加算

ストリーム同士の加算も容易にできます。以下のコードはストリーム同士をを加算する方法でフィボナッチ数列を定義しています。

(define (add-stream s1 s2)
  (stream-map + s1 s2))

(define fibs
  (cons-stream 0
               (cons-stream 1
                            (add-stream (stream-cdr fibs)
                                        fibs))))
gosh> (stream-ref fibs 10)
55
gosh> (stream-ref fibs 100)
354224848179261915075
gosh> (stream-ref fibs 1000)
43466557686937456435688527675040625802564660517371780402481729089536555417949051890403879840079255169295922593080322634775209689623239873322471161642996440906533187938298969649928516003704476137795166849228875
gosh> (stream-ref fibs 10000)


参考

  • Structure and Interpretation of Computer Programs