スキップしてメイン コンテンツに移動

テキストをNグラムに分割するJavaプログラム

与えられたテキストをNグラム(n-gram)で分割するJavaプログラムです。
Javaの標準ライブラリのjava.util.ArrayList、java.util.Listを使っています。

public static List<String> splitByNGram(String src, int n)
{
    List<String> chunks = new ArrayList<>();
    for(int start = 0, len = src.length(); start < len; start++)
    {
        int end = start + n;
        chunks.add(src.substring(start, end < len ? end : len));
    }
    return chunks;
}

コメント