与えられたテキストをNグラム(n-gram)で分割するJavaプログラムです。
Javaの標準ライブラリのjava.util.ArrayList、java.util.Listを使っています。
public static List<String> splitByNGram(String src, int n)
{
List<String> chunks = new ArrayList<>();
for(int start = 0, len = src.length(); start < len; start++)
{
int end = start + n;
chunks.add(src.substring(start, end < len ? end : len));
}
return chunks;
}
コメント