The matrix A is chosen by iteratively drawing uniformly a random matrix out of the 2^(4k^2) possible binary matrices of this size, until it is not singular. This process terminates after an expected four iterations regardless of the size 2k.
The list is sorted according to the lower l bits of the hash value of the mers, and ties are broken lexicographically. Sorting the output has the advantage that the results can be queried quickly using a binary search.
More interestingly, it has the advantage that it allows two or more hash tables to be merged into one easily.
This situation occurs when there is not enough memory to carry out the entire computation and intermediary results are saved to disk.
そのリストはMERSにおけるハッシュ値の下位にある1バイト行によってソートされ、タイは辞書編算方式で分けられる。出力データのソートは、二分検索をかけることで結果を迅速に問合すことができるという利点がある。
さらに興味深いのは、2つ以上のハッシュ表をたやすく1表にまとめられるというメリットを備えていることだ。
この状況は一通りの計算を行うだけのメモリが十分にない場合に起こり、中間結果はディスクに保存される。
リストは、メールのハッシュ値の低度の1ビットに基づき分類され、その結びは、辞書学的により解かれる。アウトプットの分類には、2元体のサーチの使用により結果を迅速に問うことができると称する強みがある。
さらに面白いことに、2つ以上のハッシュテーブルの1つのテーブルへの統合を可能にすると称する強みもある。
このような状況が発生するのは、全計算を行なう十分なメモリを擁せず、中間的な結果がディスクに保存される場合である。