mobi reader dictionary 제작 로그 (1)

요새 굉장히 게을러져서.. 몇줄 글 쓰는 것도 싫은 상태인데, 이러면 도저히 안될 듯 해서 조금씩 로그를 남겨본다. ㅠㅠ

이전 포스팅에서 말한바와 같이, 김원철님의 tab2html 을 사용해서 제작하는데,
먼저 스타딕 tab포멧으로 변환시킨 후에 변환을 시킨다.

과정중에 태그를 사용한 문서이기 때문에 < 와 >을 변환시키는 부분을 빼주었다.
arrow???.xml 파일 두개를 삭제하고 bat 파일을 조금 고쳤다.

그리고나서 배치파일을 돌려서 MyDict.html 파일을 만든다.
원래는 opf, prc 파일까지 다 한번에 만드는데.. 나는 그림파일이 들어간 사전을 제작하는 관계로 일단 html만 만든다.

그리고 mobiporket creator 를 설치하고 새 publication을 만든다.
대충 이것저것 설정해주고 publication file 에 모든 그림파일과 만들어놓은 MyDict.html을 넣는다.
인코딩은 utf8, 북타입은 html, This ebook is a dictionary 에 체크, 메타데이터는 내맘대로, 커버도 넣으면 더좋고..
그 이전에 셋팅에서 copy external files into publication 에 체크 해제하는게 좋다. 안그러면 그림파일 다 복사하느라 세월아 네월아..

저장하고 빌드하면 된다. 빌드 로그가 잘 나와준다. 그림이 1200여개인 사전은 이와 같은 방식으로 변환이 매우 쉬웠다. 그러나 변환시간이 생각보다 오래걸렸다.



그리고나서 개인적으로 사용하는 백과사전을 변환시켜보려 했는데.. 이번에는 그림이 약 15,000개. mobiporket creator에서 읽어오는데 한시간도 더걸렸다. 왜이리 느린지는 모르겠다. 컴퓨터가 구형이긴 하지만..
그리고 두세시간 변환하다 오류가 자꾸 나와서 오류 잡느라 아직 완성을 못했다. 너무 오래걸리니까 귀찮다. 에휴..


일단 그림파일이 들어가면 사전 만들기가 까다로운듯 싶다.
그리고 폰트문제도 아직 해결되지 않았다..
또한 지원되는 태그 목록도.. 잘 모르겠다. 그런데 일단 가진 사전들 대다수가 잘 변환될듯 싶다.

그림이 안들어간 stardict 나 mdict html 파일을 한방에 변환시켜주는 스크립트를 짜볼까 생각하는데..
생각보다 귀찮고 어렵다. 프로그래밍 초보의 한계.. 

by 너구리 | 2009/12/28 19:50 | PDA | 트랙백

X5800을 위해서 모비리더 사전을 만들어보고 있다.

그런데 이전에 쓰던 mdict 이나 stardict 과 달리 무척이나 체계적인 구조로 되어있어서.. 제작하기는 더욱 까다로워졌다.

단순히 인덱스와 내용만 있는것이 아니라 인덱스도 다양하며, 여러 검색법, 링크 등이 존재해서 메뉴얼을 잘 확인해봐야겠다.


일단 김원철님의 mdcit2mobi 와 tab2mobi 를 적절히 수정하고 mobipocket creator 를 이용해서 그림이 들어간 html 사전파일을 제작해 봤는데, 상당히 만족스러웠다. 속도와 레이아웃 모두 흠잡을데가 없었다.

문제는 X5800의 폰트가 지원하지 않는 문자가 상당하다는 것인데, mobi reader의 폰트 변경이 가능해 보여서 테스트해볼 예정이다. 안되면 5800의 폰트를 폰트라우터를 이용해서 교체해볼 생각이다. 그리고 가지고 있는 사전의 발음기호나 몇몇 한자의 경우에 이미지 파일인데, 고해상도의 5800에서 보기에는 조금 난감하다. 어떻게 수정해야 할지 생각해봐야겠다.

모바일 기기에서 폰트 문제는 언제나 쉽지 않다. 직접 제작한 폰트들은 문제가 많기 때문이다. WM에서는 fontlink 로 여러 폰트를 묶음으로서 해결했었는데, 5800은 어떻게 될지 모르겠다. 안되면 특수문자+고어+발음기호를 한개의 폰트에 넣어야 하는데, 폰트 크리에이터로 해도 쉽지 않더라.


일단 시간이 되면 mobi 파일의 구조에 대해 공부해본 후에 beeliner 나 autoit3를 이용해서 mdict -> mobi dic 이나 stardic -> mobi dic 을 제작해봐야겠다.


되는데로 해보고, 로그를 남겨야겠다.
그리고 버스노선이나 금영 노래표 정도는 컨버팅해봐야겠다.


mdict 2 mobi
http://wagnerian.tistory.com/119

mobi dic 공식 메뉴얼
http://www.mobipocket.com/dev/article.asp?BaseFolder=prcgen&File=indexing.htm

by 너구리 | 2009/12/14 21:50 | PDA | 트랙백 | 덧글(3)

teedict java 사전 사용...불가능

노키아 익스프레스 뮤직 5800 에서 사용하기 위해서 테스트 해봤습니다.
테스트 환경은 win xp, java 최신버전, teedict 데탑용입니다.

 
이거 안되는거나 다름없습니다.
사용 가능한 사전은 데탑용 teedict을 받고 online dictionray 에서 받은 사전만 사용 가능합니다.
기타 사전은 전혀..지원이 안됩니다. stardict editor 버전을 타는듯도 하지만... 그것만도 아닌듯 합니다.

심지어 사용 가능한 사전을 stardict editor 로 변환 해제 -> 변환 해도 사용 불가능합니다.
stardict 사전 단어 두개짜리 만들어서 넣어도 안됩니다.
특수문자에 문제 있나해서 다양한 방법으로 저장해봤고, 태그 사용도 안해봤고, tab형태로도 만들어봤습니다.
line feed 에 문제있나 해서, unix line feed 사용해도 안됩니다.
 
tab형 문서로 제작했는데, 그래도 인식이 안됩니다.
 
가지고있는 mdict 사전 백여개 테스트 해봐도 안됩니다.
html 이 아니라 txt형 mdict 사전 제작해서 테스트 해봐도 안됩니다.
 
사용가능한 한국사전 종류는..
퀵 영한사전
영한사전
법률사전
한자사전
국어사전
수의학사전
의학사전
한러사전
입니다. 테스트는 다 안해봤습니다.
 
 
결론 : 다운받아서 사용하는 사전 몇개 빼고 다 안됩니다.
 
뭐 폰에서 테스트 한다고 다른 결과가 나올거라 생각하지는 않습니다.
사용 가능한 사전 데이터는 빈약해서 별로 쓰고싶지 않네요.
차라리 mobi 리더기로 힘겹게 쓰는게 더 좋겠습니다.

by 너구리 | 2009/12/04 21:37 | PDA | 트랙백 | 덧글(0)

양자역학에 대한 이야기

일반물리를 배우고서 슬슬 전공과목으로 들어가는 시기

글쎄, 군대를 갔다왔더니 친구들이 양자역학을 듣고 있더니, 하나같이 한다는 말이

"양자역학이 나를 기만해" "날 바보로 만들어" "이게 무슨말이야" "외계어" "한글이나 영어나 외계어나 똑같아"

물리학도가 되겠다 다짐하고 살아온 녀석들에게도 공포감을 주는 양자역학의 세계!



양자역학 다큐
http://28boy.tistory.com/274

by 너구리 | 2009/09/27 18:09 | 물리학 | 트랙백 | 덧글(0)

링고스 사전(Lingoes Dictionary) html로 변환하기

사전데이터는 공유하지 않지만,,
제작법은 공개하기로 했엇던고로, 허접한 소스를 공개해봅니다.


AutoIt 3 를 사용했습니다.

소스에 있는 내용중 key.687C79C9CA647F4B89D4F007ED9BA68A 는 사전마다 다르며

file:///C:/Program%20Files/Lingoes/Translator2/dict/image/entry_ph.png 또한 임시파일 저장 위치에 따라 다릅니다.

그리고 몇몇 사진이 첨부된 사전의 경우에, 특정 위치에 그림파일이 저장됩니다.
만들어진 html 에서 img태그의 src를 보면 알 수 있습니다.



간단한 설명을 하자면, 링고스 사전을 인식하고 사전 내용 부분을 읽어와서 파일에 쓰는겁니다.
그런데 필요없는 값들이 상당히 많은 관계로 약간의 편집 후 저장하는데요 그게 stringreplace 함수를 사용하는 부분들입니다.
취향대로 고치시면 될듯 합니다.
물론 완성된걸 바로 사용하실 수는 없고, 기타 에디터나 프로그램으로 정규식 처리하셔서 더 손보셔야합니다.

궁금한사항 있으시면 네이버 사전만들기 카페에서 공부하시면 될듯 합니다.

Lingoes2html.au3

by 너구리 | 2009/06/20 22:03 | 트랙백 | 덧글(1)

P100 터치스크린의 문제점.

반응이 굉장히 느리다.
연속적인 태핑이 안되고 씹힌다.

본래 반응이 느리다는 말은 있었기 때문에 뽑기 실패인지, 기기 설계상 원래 그런지는 모르겠다.

먼저 sph m4650 에서 모아키 타이핑 동영상을 보자.


앞소절만 타이핑하는데 대충 17초 내외.. 그것도 치다가 오타수정하는 과정이 들어있다.



다음으로 gb p100 에서 모아키 타이핑 동영상을 보자.


앞소절을 타이핑하다가 포기했다. 분명 태핑한 소리가 들리는데, 화면에 반응이 안온다. 이건 어쩌자는건지..
연속적인 입력은 씹힌다.. 그래.. 너 느리다 이거지? ㅠㅠ

가장 익숙한 입력기가 모아키인 관계로 모아키로 테스트했다. 둘다 모아키 1.0
p100에서는 모아키 뿐만 아니라, 네오 스타일 3.5, 토탈키보드, 심지어 기본 키보드조차 비슷한 반응을 보여준다..


그저 눈물이 앞을 가릴뿐..
반응이 느린건 참겠는데 입력이 느린건 못참는다.. 키보드 없는것도 서러운데.,.,

by 너구리 | 2009/06/20 21:34 | PDA | 트랙백 | 덧글(3)

T-Flash(MicroSD) 메모리 카드 구입

p100을 구입하면서 메모리카드가 하나 더 필요해서 구입했다.


Transcend MicroSDHC 8GB Class6 (TS8GUSDC6)
http://www.transcendusa.com/Products/ModDetail.asp?ModNo=195&SpNo=1&LangNo=0

파일을 직접 복사해보니 상당히 느린 기분이다.

그래서 ATTO Disk Benchmark 를 실행해 보았다. (신뢰도는 상당히 떨어지는 툴이지만 상대비교하기엔 적절한듯 싶다)


1. 트랜샌드 8GB (MicroSDHC class6)



2. 샌디스크 4GB (MicroSDHC class2)



3. 트랜샌드 1GB (SD 133x SLC로 추측)




7년전에 64mb cf를 사며 싸다고 기분좋아하던게 아직 잊혀지지 않았지만,
이젠 더 작고 싸고 빠른걸 원한다.
결과는 불만족. 차라리 샌디스크 8gb class 2를 살걸 그랬다.
pda에서 사용하기 때문에 읽기 최대속도는 별 의미가 없고, pc에서 리더기를 통해 파일을 카피하는 속도가 빨라야 하는데
class6가 class2 보다 2/3 속도밖에 안나오는 현실. 트랜샌드 두고보자! (물론 class 6 속도는 충분히 만족한다..)

저용량 읽기 속도는 트랜샌드가 미세하게 빠르다. pda에서 실제로 사용할때는 더 좋을지도 모르겠다.

테스트는 중국산 멀티리더기인 관계로 최적화는 아니다.

by 너구리 | 2009/06/19 13:17 | PC | 트랙백 | 덧글(0)

◀ 이전 페이지          다음 페이지 ▶