MeCabでha_maが["ha","_","ma"]と分割されてしまう
ので繋げてみた。もっといいやり方があるはず。
# ["A","_","B"]->["A_B"]に直す def connectUnderScore(array): retArray = [] i = 0 while(i < len(array)-2): if array[i+1] == "_": retArray.append(array[i] + "_" + array[i+2]) i+=3 else: retArray.append(array[i]) i+=1 print i if(i < len(array)):retArray.append(array[i]) if(i+1 < len(array)):retArray.append(array[i+1]) return retArray