라벨이 온톨로지인 게시물 표시

시맨틱웹 세미나

이미지
시맨틱웹 세미나를 소개합니다. 거대 온톨로지가 아닌 데이터간의 링크가 시맨틱웹으로가는 한걸음임을 보여주는 자리가 되었으면 좋겠습니다. 링크 : http://www.gimyo.co.kr/semanticweb/ 김홍기 교수 현) 서울대학교 치과대학 교수 서울대의생명지식공학연구실 서울대학교 인지과학 협동과정 겸임교수 아일랜드 국립대학교 정보공학부 겸직교수 IBM developerWorks 컬럼리스트 시맨틱 웹 2.0 컨퍼런스 조직위원장 Korea Web 2.0 그룹 멤버 웹은 링크와 함께 진화하고 있는데, 링크를 구성하는 데이터도 다양해 지고 있다. 웹의 진화를 링크와 데이터의 관점에서 살펴보고, 의미적 연결을 지원할 수 있는 시맨틱 웹을 초기 등장부터 살펴본다. 더불어 시맨틱 웹을 실현하기 위한 기술적 기반으로 버스 시스템을 소개하며 의료 분야에서 시맨틱 웹과 데이터 링크의 사례를 소개한다. 1. 웹 그리고 링크의 진화 2. 웹에서의 데이터 3. 시맨틱 웹의 과거, 현재 그리고 미래 4. 시맨틱 웹 버스 시스템 • RDF 와 온톨로지 • 포크소노미 • SPARQL 5. 응용사례 : 의료분야의 데이터 링크 김광섭 현) NHN 시맨틱웹TF팀 근무 • 블로그 : http://bklab.snu.ac.kr/blog/kwangsub • 시맨틱웹 팀블로그 : http://semantic.tistory.com RDF 를 이용해 Resource(데이터) 를 표현 & 전달하기 위한 스팩들을 살펴본다. 이러한 스팩들은 웹에서 사용될 수 있는 의미적 리소스들을 표현 전달 (재)사용할 수 있도록 지원한다. 1. 데이터를 공유하자 • rss, dc, foaf, sioc, scot 2. 웹 안의 데이터를 사용하기 위한 전초전, 어노테이션 • RDFa(Cadidate Recommendation) 3. 실용사례 - 데이터를 내 품에 • 공유된 데이터의 재사용이 가능한 시나리오 소개 정지웅 현) NC 소...

[후기] KISTI 기술 발표회

이미지
오늘 KIST기술발표회에 다녀왔습니다. 언제나 그러하듯 발표회 초반은 딱딱하더군요. ^^ 소개인사가 지나고 각 세부별로 올해 진행한 과제결과를 설명해주셨습니다. 데부분인 소개다음 데모를 중심을 진행되었고요. # KISTI의 데모를 진행하기에 앞서 IBM에서 자사에서 생각하고 있는 시맨틱 검색에 대해 애기해주셨습니다. CAS(Common Analysis Structure, 언듯 들으면 맥주이름 같기도 한데요.^^)와 UIMA라는 플랫폼이 시맨틱검색을 가능케 하는 환경을 제공한다고 합니다. UIMA는 버전2.0부터는 IBM을 떠나 Apahce의 오픈소스화 [1] 되었다고 합니다. 데모는 없었고요, 실제 사용하고 있는 레퍼런스 사이트를 알려달라는 어느분의 요청에 그분에게만 개인적으로 알려준다고 하시던데 이유는 모르겠습니다. ㅋ # 다음은 Star검색 [2] 의 설명과 데모가 있었습니다. 2007년 2월부터 작업을 시작했다고 하는데 발표하시는 발표자님의 목소리에 자신감이 팍팍 넘쳤습니다. 화려한 UI를 보고 Web2.0을 얘기하는 몇몇 사람들에게 "우리는 Web40.0정도로 만들었다"라며 재치를 보여주셨습니다. [2] 페이지에 들어가시면 3가지 버전을 보실 수 있습니다. 0.9버전은 계정이 필요하더군요. 그걸 제외하면 크게 플래시 버전과 HTML버전이 나옵니다. 발표자님 말에 따르면 플래시 버전은 20~30대를 위한 다이나믹한 웹40.0에 상응하는 인터페이스를 제공합니다.^^ 기능은 HTML버전과 동일합니다. 다만 플래시로 화려한 UI를 제공한다고 합니다. 다음 HTML버전입니다. 포탈의 이미지를 벗고 사용자가 원하는 것만 보여주는걸 목적으로 한다고 합니다. "세포"를 입력하면 하위어, 우측절단어, 좌측절단어를 제시해줍니다. (어제 데모에서는 빈도수도 나왔던거 같은데 오늘은 안나오네요.)[IE에서만 됩니다. 파이어폭스는 지원을 안하네요] 하위어와 관련어들에 대한 반환이 어떻게 이루어지는지 궁금해서 발표후에 따로 만나서 몇마디 나누...

OpenRDF - Sesame Benchmark

이미지
Sesame 은 RDF데이터를 처리(쿼리, 추론, 저장)하는 Open Framework입니다. 여러 모듈들이 합쳐저 있지만 그 중에서 단연 밀고있는건 Htttp통신을 이용한 RDF데이터 전달이 아닌가 싶습니다. Sesame 내부에는 openrdf-sail이나 openrdf-rio등과 같은 수많은 모듈들이 사용되는데 http://www.aduna-software.org에서 Open소스로 관리되고 있습니다. 살펴보면 쓸만 한 API들이 꽤 됩니다. 아래 그림처럼 HTTP를 이용해서 RDF데이터를 주고 받습니다. 각각의 컴포넌트들은 모듈별로 관리되고 있습니다. (http://www.aduna-software.org/projects 뭐 가도 많은 정보는 없네요. ^^) Repository 는 SailRepository와 HTTPRepository가 있는데요. SailRepository는 독립적인 Repository를 만들수 있게 해주고 HttpRepository는 원격에 있는 Repository의 Connection을 가져와 처리할 수있게 합니다. Repository myRepository = new HTTPRepository("http://localhost:8080/sesame_server", repositoryID); //원격에 있는 서버 연결 Repository mySailRepository = new SailRepository(new MemoryStore(tempDir)); //로컬의 RDF파일을 이용해 Repository생성 HTTPRepository를 이용 주력으로 밀고있는 HTTPRepository를 이용하는 방법을 알아보죠. Sesame server 설치방법 http://www.openrdf.org/download.jsp Sesame 2.0 beta releases를 다운 (tar나 zip을 다운받는다.) 압축 해제 openrdf-sesame-2.0-beta6/war/에 두개의  war파일이 존재 openrdf-...

차세대 웹 전망 세미나 & 웹

이미지
차세대 웹 전망 세미나에 왔습니다. 총 8개의 세션이 이루어졌습니다. 역시나 인상에 남는 내용은 실제 데모시간들이지 않나 싶네요. 제품 소개가 주를 이뤘던 SAC2007 과는 다른 분위기였습니다. 시맨틱스(www.semantics.co.kr)에서  아직 서점에선 찾을 수 없다는 A Semantic Web Primer번역서를 한권씩 나누어주시더군요. 전보다는 많은 사람들이 쉽게? 접할 수 있겠어요. (그랜드 볼륨 101호가 반이 갈라져있었는데 저렇게 큰 칸막이가 위로 올라가는지 아님 손수?땠다 붙였다하는지 궁금했습니다. ㅋㅋ) 간략한 후기를 적어보겠습니다. #원광대 한성국 교수님께서 웹2.0, 시맨틱웹, 온톨로지에 대한 개략적인 설명을 해주셨습니다. #솔트룩스 이경일 대표님께서 시장동향과 국내외 프로젝트에 대해 소식을 전해주었고요. 국내외 시맨틱웹전망이 밝아 보여 다행이네요. ^^ #KISTI의 정한민님께서는 학술연구정보서비스 사례에 대해 발표해주셨습니다. 밑단에서 어떻게 도는지도 궁금했고, UI수준에서도 참 많이 신경쓰신 티가 팍팍 났습니다. 학술데이터라는 훌륭한 테스트 데이터셋이 있어서인지 이것저것 참 많은 시도가 있었던것 같습니다. 궁금한 점이 많아 직접 물어보러 갔었는데 워낙 바쁘셔서 메일로 질문을 드려야했습니다. ^^; 질문의 내용은 답이 오면 다시 한번 포스팅하기로 하죠. 카메라가 있다는걸 깜빡하고 동영상을 못찍었네요. ㅋ 후에 알았다는... #시맨틱스의 조광현님께서는 시맨틱 검색엔진의 데모를 보여주셨습니다. 예전에 어떤 플러그인?을 배포했던 회사로 기억하는데요, 그때 들어갔을때는 사이트가 마치 유령회사 같았는데 지금은 잘 정돈되어 있더군요. ( www.semantics.co.kr ) 시맨틱스에서는 자사제품인 ONTOrobo, DOCUrobo, TAGrobo, PERSONALrobo를 들고나와 데모모습을 보여주셨습니다. ONTOrobo는 단어에 대한 카테고리 분석해줍니다. 예를들어 "노무현"이라는 단어가 들어오면 이 단어가 어느 카테...

Ontology/SemanticWeb Summer Camp 소개(가칭)

어제 김홍기 교수님을 만나 온톨로지/시맨틱웹에 관심이 있어하는 사람들간의 커뮤니티 형성을 위한 캠프형식의 워크샵?에 대해 논의하고 왔습니다. 교수님께서는 Semantic Web 2.0 Conference 에 참석하셨던 연구/개발자들간의 정기적인 만남을 이어가야한다고 말씀하셨었죠. 취지는 Daum Dev Night 의 것과 비슷합니다. 단지, 관심분야의 중심이 Web2.0이 아닌 온톨로지, 시맨틱웹이란 것이지요. (중심일 뿐이지 다른 어느것을 배제한다는 것은 아닙니다.) 진행방식은 토이 프로젝트를 만드는 것입니다. BikeLab 에서 프로젝트에 대한 몇몇 주제들을 제공할 예정이고요. Dev Night때 처럼 만들어 보고 싶은 프로젝트를 제안해도 됩니다. 일단, 무척 기대됩니다. 같은 주제를 가지고 연구/개발하는 사람들을 만날수있는 좋을 자리가 될 수 있을것 같습니다. 제 블로그 제목에도 그럿듯 정말 시맨틱한 무언가가 서비스되는 그날까지..고고싱~ 아. 상품(상금)도 있을거랍니다. 후후 아직 정확한 일정이나 프로그램이 결정된 상태는 아니고요. 새로운 소식이 있으면 바로 소개해드리겠습니다.

JenaRDB로 Sparql수행하는 예제

funtheory님의 질문에 포스팅합니다. 우선 온톨로지를 JenaDB로 만들었고, 모델을 가져올 수 있다는 가정하에 함 보죠. 물론 Sparql도 안다는 가정. OntModel model = getOntModel("모델URI"); //모델을 가져옵니다. //getOntModel메소드 추가합니다. private Model getOntModel(String urn){       PersistentOntology po = new PersistentOntology();       ModelMaker maker = po.getRDBMaker(s_dbURL, s_dbUser, s_dbPw, s_dbType, false);             Model model = maker.getModel(urn);         return model;   } 가져온 모델을 이용해 Sparql을 돌려보죠. (온톨로지에는 Person클래스와 nameOfPerson이라는 String타입의 프로퍼티가 있다고 가정할께요.) private void runSPAQL(OntModel model){       //Query query1 = QueryFactory.read("test.rq", "ko");        //이렇게 파일로 만들어도 되요. 메모장에서 utf-8로 저장해야할겁니다. 가물~             Query query1 = QueryFactory.create("PREFIX dc: <http://purl.org/dc/elements/1.1/#>\n" +               "PREFIX owl: <http:/...

Ontology를 사용하면 '사용자'에게 어떤 이득이 있나요?

작년까지 학교에 있었고, 현재 업체에 있는 나의 경우, 답하기 힘든 질문중에 하나는... "Ontology를 사용하면 사용자에게 어떤 이득이 있나요?" 학교에 있을때야 돈이 안되도 그냥 관심가는 분야였고, 뭔가 될거라는 막연한 생각도 했던것 같다. 예전에 어디서 연락을 받고 왔는지는 모르겠지만 다른 업체에서 2006년도 수행했던 과제결과물에 대한 관심을 보이며 관련정보를 보여달라고 찾아왔었다. (작년 과제는 온토롤지 구축과 기반 서비스 프로토타입 시스템 개발이였다. ) 아는건 별로 없지만 예제도 보여주고 구현된 결과물도 보여주면서 성심성의것 답변 해주었다. 답변이 끝나갈 무렵, 그 분이 한 질문이 바로 "온톨로지를 사용하면 사용자에게 어떤 변화가 있나요?"였다. 난  대답했다. "글쎄요 ^^;; 어려운 추론이 섞인 질의나 단순한 전화번호를 묻는 질문이나 17인치 모니터안에서 보이는 것들은 동일할거예요." 어려운 추론이 섞인 질의나 단순한 질이든 사용자 입장에서는 뭐가 되었든 동일할것이고 동일해야 한다고 생각한다. 사실 사용자 가 얼마나 어려운 질의 를 하겠는가!? 별로 안좋아할껄. 차이는 그 다음부터라고 생각한다. 그 사람에게 맞는 서비스를 무엇을 어떻게 더 제공하느냐가 문제일뿐... 소리소문없이... 가끔 거대한 온톨로지를 만들어 이것만 구축되면 진정한 시맨틱웹이 구현될거라고 말하는 사람들을 본적이 있다. 웹이 온톨로지/시맨틱을 아는 사람들의 판은 아니기에 그런 관점이 아닌 보편적으로 웹을 바라보는 사람들의 관점에서 바라봐야한다. terrie 님의 블로그에서 RDFa Primer 1.0 소식을 접했다. HTML안에 RDF를 삽입하는 구조이다. 예전에 SHOE에서 했던 구조와 비슷하지만 태그를 기술하는 방식이 좀더 명시적이다. <html xmlns:contact="http://www.w3.org/2001/vcard-rdf/3.0#"> <span property="c...

SAC2007 후기

이미지
리츠칼튼 호텔에서 열린 SAC2007 에 다녀왔습니다. (좀 늦었네요) 리츠칼튼 호텔이라는 곳을 태어나서 처음 가봤습니다. 기억에 남는것만 몇자 적어볼께요. Semantic Web 2.0컨퍼런스 에 비하면 절반도 안되는 사람들이 온것 같더군요. (아마 동시에 Web2.0컨퍼런스가 다른곳에서 하고 있어서 그런것 같기도 합니다.) Web2.0보다는 사람들 보이는 연령대? 가 조금은 높은것 같다란 생각도 들고요. ^^; Deri Innsbruck 에서 오신 Dieter Fensel아저씨는 Service Web 3.0 ?이라는 기괴한 물건을 가지고 나오셨더군요. 지금도 앞으로도 수많은 서비스들이 출몰하게 되는데 그 감당못하는 서비스들에 대한 Discovery가 중요할 것이며, 올해안에 대기업들이 그런 인프라를 만드는데 뛰어들것이라고 자신의 월급을 걸고 확담을 했습니다. (Deri Innsbruck은 Semantic Web Services에 대한 연구가 많은 걸로 알고 있습니다. 해서 이의 확장팩이 아닌가 싶네요.) 대부분 회사, 제품소개, 프로젝트를 중심으로 발표가 진행되었어요. 그 기술에는 온톨로지가 한 몫을 단단히 할것이라는 얘기와 함께요. "시맨틱웹"이라기 보다는 "시맨틱한 뭔가"에 관심이 많은듯 했습니다. 개인적은 느낌엔 아직 큰 구름이 많은 것 같았어요. 그걸 해서 내세울만한 뭔가가 없어서인가요? 그림을 너무 크게 잡아서 인가요? 기업(Enterprise)를 중심으로 한 그림을 그리고 있지만 Ontology Evaluation, Methology에 대한 문제는 남아 있는것 같습니다. 예전에 ETRI에서 리죽스 기반 데스크탑검색에 대한 기사 를 봤는데, ETRI연구원님께서 발표하시는 내용에 부분 속해 있더군요. (윈도우랑 웹에서도 된다는군요. 웹에서 데스크탑검색?) 관심이 있었던 Annotaiton(그냥 태깅)을 하는 부분은 자동적, 반자동적으로 의미정보를 추출한다고 합니다. 자동부분에 있어서는 NER을 통한 기존 IR에서...

온톨로지 - 개념의 표현(1)

이미지
An ontology is a specification of a conceptualization - Tom Gruber 아마도 많은 사람들이 저 문장으로 온톨로지를 이해하고 있는 내용인것 같다. 예전에 가끔 “온톨로지가 뭐냐?”는 질문에 머리속에서 온갖것들의 조합이 엉켜져 있어 어떻게 대답을 할까 고민했었다.(사실 지금도 그리 깔끔하게 풀려있지는 않은것 같다.:-)) 저걸 물어보는 사람이 이쪽을 얼마나 아는 사람이냐, 관심이 있는 사람이냐에 따라..등등, 아니면 어떻게 도망갈까? ^^;; 지식영역의 사물들을 표현하고 기술하는데 사용되는 용어들을 정의한다. 하늘의 금성이라는 개념을 예로 들어보자. 사람에 따라 “금성”, “제일 밝은 별” 또, 금성의 출현시기에 따라 저녁 무렵에 보이는 금성을 “태백성”, “장경성” 혹은 “개밥바라기”라 부르며, 일몰 전후 혹은 새벽 무렵에 보이는 금성을 “샛별”, “명성”이라 부른다. 그렇지만 우리가 금성이란 개념을 지칭하기에 앞어 그전에 금성은 금성이였다. 어떻게 언제 보아도 고유의 속성들을 지닌 금성이다. 온톨로지는 이런 개념, 속성들의 정의, 그들간의 관계를 표현한다. 사람이 온토로지를 구축할 때, 가장 많이 사용되는 방법이 Top-down일거다. 당연한 것이 난 “차”가 뭔지 알고 적어도 “오토바이”와의 차이점도 안다. 더불어, “차”, “오토바이”가 가지고 있는 속성도 안다. 그렇기 때문 컨셉의 정의를 만들고 속성들을 붙여나간다. 이렇게 개념을 정의한다. 반대로 속성들에 의해 컨셉이 정의 되는 Bottom-Up방식도 있다. “이동한다”, “바퀴가 2개다”, “뚜껑이 없다” 이 3개의 속성으로 오토바이임을 나는 안다. 하지만 “자전거”도 저 속성을 만족한다. Bottom-Up의 방식은 도메인이 한정되어 있는 분야에서 사용되야 할것이다. 결국 중요한건 온톨로지는 Top-down이건 Bottom-up이건 개념의 표현이란 것이다. origin source : http://chord.snu.ac.kr/~kskim/wp/...