与えられたテキストをNグラム(n-gram)で分割するJavaプログラムです。
Javaの標準ライブラリのjava.util.ArrayList、java.util.Listを使っています。
public static List<String> splitByNGram(String src, int n) { List<String> chunks = new ArrayList<>(); for(int start = 0, len = src.length(); start < len; start++) { int end = start + n; chunks.add(src.substring(start, end < len ? end : len)); } return chunks; }
コメント