2019년 10월 21일 월요일

How to select random 100 words to code from CHILDES transcripts

1. Clan 에서 다음 명령어를 돌려 tokenized word list 를 저장한다. (파일이름을 일일히 손으로 써야하는 단점)

vocd +t*MOT +d -t%mor 21_A0P05M.cha > 21_A0P05M.txt

2. R 에서 다음 명령어를 돌려 랜덤 단어를 100개 저장한다.

scan(file=file.choose(), what="char",encoding = "UTF-8", sep=" ") -> file1
sample(file1,100) -> file1.sample
unlist(strsplit(file1.sample, " ")) -> file1.sample
cat(file1.sample,file="21_A0P05M.txt",sep="\n")



댓글 없음:

댓글 쓰기