[후기] KISTI 기술 발표회

오늘 KIST기술발표회에 다녀왔습니다. 언제나 그러하듯 발표회 초반은 딱딱하더군요. ^^
소개인사가 지나고 각 세부별로 올해 진행한 과제결과를 설명해주셨습니다.

데부분인 소개다음 데모를 중심을 진행되었고요.

#
KISTI의 데모를 진행하기에 앞서 IBM에서 자사에서 생각하고 있는 시맨틱 검색에 대해 애기해주셨습니다. CAS(Common Analysis Structure, 언듯 들으면 맥주이름 같기도 한데요.^^)와 UIMA라는 플랫폼이 시맨틱검색을 가능케 하는 환경을 제공한다고 합니다. UIMA는 버전2.0부터는 IBM을 떠나 Apahce의 오픈소스화[1] 되었다고 합니다. 데모는 없었고요, 실제 사용하고 있는 레퍼런스 사이트를 알려달라는 어느분의 요청에 그분에게만 개인적으로 알려준다고 하시던데 이유는 모르겠습니다. ㅋ

#
다음은 Star검색[2]의 설명과 데모가 있었습니다. 2007년 2월부터 작업을 시작했다고 하는데 발표하시는 발표자님의 목소리에 자신감이 팍팍 넘쳤습니다. 화려한 UI를 보고 Web2.0을 얘기하는 몇몇 사람들에게 "우리는 Web40.0정도로 만들었다"라며 재치를 보여주셨습니다. [2]페이지에 들어가시면 3가지 버전을 보실 수 있습니다. 0.9버전은 계정이 필요하더군요. 그걸 제외하면 크게 플래시 버전과 HTML버전이 나옵니다. 발표자님 말에 따르면 플래시 버전은 20~30대를 위한 다이나믹한 웹40.0에 상응하는 인터페이스를 제공합니다.^^

사용자 삽입 이미지

기능은 HTML버전과 동일합니다. 다만 플래시로 화려한 UI를 제공한다고 합니다. 다음 HTML버전입니다. 포탈의 이미지를 벗고 사용자가 원하는 것만 보여주는걸 목적으로 한다고 합니다. "세포"를 입력하면 하위어, 우측절단어, 좌측절단어를 제시해줍니다. (어제 데모에서는 빈도수도 나왔던거 같은데 오늘은 안나오네요.)[IE에서만 됩니다. 파이어폭스는 지원을 안하네요]
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

하위어와 관련어들에 대한 반환이 어떻게 이루어지는지 궁금해서 발표후에 따로 만나서 몇마디 나누었습니다. 현재 Star서비스는 온톨로지는 전혀 사용하지 않고 워드넷만을 이용해 시맨틱검색이 가능하게 했다고 합니다. (왜 부스에 있던분은 온톨로지를 자체제작했다고 했는지 모르겠네요. ^^) 단, 아쉬운 점은 워드넷만을 이용한 시맨틱 검색?은 단어간의 매핑일뿐 실제 의미간의 매핑이 아닐수 있다는것이지요. 실제 동음이의어 같은 문제가 나올수 있다는거지요. 그래서인지 다음데모에 보인 OntoFrame서비는 URI기반 개체 인식 시스템을 이용한 검색 서비스를 발표했습니다.

#
다음은 OntoFrame[3]의 소개와 데모가 있었습니다. URI체계를 이용한 개체식별기술을 이용한 검색서비스 데모를 보여줬습니다. 예를들어 "Barry G.T. Lowden"과 "Barry Lowden"이 동일한 사람일때 검색결과의 문제, 혹은 "Barry Lowden"과 "Barry Lowden"이 다른 사람일때 검색결과의 문제를 해결하고자 하는 것이지요. 학술DB에 개체로 인식할만 것들을 URI로 매겨놓고(어노테이션) 검색을 수행합니다. 약간의? 수작업이 필요하겠지요. [IE에서만 됩니다. 파이어폭스는 지원을 안하네요]
사용자 삽입 이미지

사용자 삽입 이미지

현재 2000만 트리플이 DB에 존재한다고 합니다. 검색질의는 SPARQL[4]을 사용한다고 하고요. 그런데도 속도가 꽤나 잘나오더라구요. 얼마전 포스팅햇던 OpenRDF - Sesame Benchmark 에서 600만 트리플을 돌리는데도 시간이 36시간이 걸렸는데요. RDBMS에 SPARQL이라는 말에 의아해 발표 후 찾아가 몇가지 질문을 했습니다.  KISTI에서는 Triple을 담을 수있는 DB스키마를 설계했고, SPARQL형태로 들어오면 그것을 SQL로 변환해서 결과를 반환하다고 합니다. 현재 KISTI의 DB스킴이 어느정도까지 온톨로지 처리를 할수 있을지 모르겠습니다. 아마도 현재 서비스에 맞게 특화된게 아닌가 싶습니다. 갈수록 밑단이 궁금해지더군요.


#
마지막에 높으신분께서 조언해주신게 생각나네요. 발표결과가 서비스를 만든것인지 기반기술을 만든것인지 혼돈되셨다는 밀이요. 그분이 말씀하신 것처럼 저장-검색-서비스에 대한 기술이 점차 쌓이겠지요. 그리고 말씀하신 타당성문제도요. 1차년도(가능성 발굴)라 그런지 어떤 프로토타입을 찾아내는데 많이 기울어진건 사실인것 같습니다. 실은 전 밑단이 더궁금하거든요. ^^

Star서비스는 12월 1일이 공식적으로 오픈한다고 합니다. 메타데이터와 워드넷을 이용한 시맨틱 검색서비스가 더욱 발전했으면 좋겠어요.

경품을 그리도 많이 주던데 한개를 못건졌습니다. 응근슬쩍 명함 3장넣었는데 벌받은듯...다음엔 한박스 넣어야겠습니다. ㅋ

아무튼 좋은 서비스를 만나게 되어 반가웠습니다.
가능성을 목표로 한 1차년도 과제 결과가 너무 멋있었어요.


====

[1] UIMA (Unstructured Information Management Architecture)
     http://incubator.apache.org/uima/
UIMA관련 기사
http://www.cheric.org/news/fortrend/view.php?seq=33756&title=&keyword=&content=
http://kisti.re.kr/yesKISTI/Briefing/Trends/View.jsp?cn=GTB2005110880

[2] http://star.kisti.re.kr
플래시버전 : http://star.kisti.re.kr/demo3/flash/
HTML버전 : http://star.kisti.re.kr/demo3

[3] http://isrl.kisti.re.kr:8080/wsearch/search/main.jsp

[4] http://www.w3.org/TR/rdf-sparql-query/

댓글

  1. 광섭군 덕분에 잘 보고 온듯 한 기분이... ㅎ 근데 STAR는 계정이 있어야 데모를 볼 수 있나봐요?

    답글삭제
  2. @sb - 2007/11/14 10:05
    어? 제가 포스팅할 당시엔 0.9버전만 계정이 필요했는데, 지금은 다 닫아 놨네요. 아마도 12월1일에 오픈을 기점으로 최종 마무리하는 것 같네요. ^^ 아마 오픈공지가 나오겠죠. ^^



    그나저나 무지 오랜만이네요. ^^ 잘지내시죠>?

    답글삭제
  3. ㅎㅎ 잘있지요! 훈련 무사히 잘 받고 나와요~

    답글삭제
  4. @sb - 2007/11/15 13:22
    네~ 잘 다녀왔습니다/~

    답글삭제

댓글 쓰기

이 블로그의 인기 게시물

Protopage.com

Android, MediaPlayer IllegalStateException 상황