thoughts

요즘은 졸업프로젝트중.

ForceCore 2008. 2. 27. 08:04

유튜브나 mncast와 같은 UCC 동영상 사이트 관리자들은

야한 동영상이 올라오지 못하도록 해야 할 터.

동영상의 일부 장면을 사진으로 만들 수 있고 그 사진이 음란물인지 아닌지 자동으로

판별하면 사이트 관리자들이 매우 편할 것이다.

 

물론 정확도 100%는 본질적으로 있을 수 없다. -_-;;

인간도 예술인지 음란물인지 논란을 하는 경우가 많으니까.

 

인간보다 정확도가 미치지 못하는 것을 만들더라도 충분히 쓸모가 있다.

음란물을 놓치지 않고, 음란물일 확률이 높은 자료를 컴퓨터가

1차로 검색해주면 관리자들은 그 것만 모니터 하면 되기 때문.

절대로 음란물이 아닐만한 다른 대다수의 다른 자료는 보지 않아도 된다는 뜻이다.

 

하지만...

어느정도까지 정확해질 수 있을까?... 모르겠음 -_-;

http://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=106&oid=003&aid=0000277482

이런 것이 등장해서 날 경악하게 하는군 -_-...;;;

 

음란물 filter는 주로 살색에 의존하는데...

"인간처럼 사진의 모양을 이해해야지"라고 말할지도 모르겠다.

but 생각보다 살색이란 것이 강력한 도구이다.

보통의 인간이라면 살색이 많은 인간모양의 것이 있으면 눈이 갈 터 -_-...;

 

살색 이외의 요소를 컴퓨터가 보게 하기 위해서

1. 이미지의 feature를 추출한다. feature는 이미지의 특징이다.

2. feature를 모아놓으면 이미지를 어느 정도 요약했다고 할 수 있겠다.

3. 이들 feature값들을 neural network나 Support Vector Machine등의 "Classifier", 분류장치에 넣고 돌린다.

현재는 음란물 판별기들은 이런 과정을 거친다.

 

이 방법이 성공하려면

사람이 feature들을 보고 "아 이거 음란물이겠네" 라는 판정이 가능해야 하겠다.

사람이 할 수 없는 것은 컴퓨터도 할 수 없다. (?! 사람도 프로그램을 실행시킬 수 있다. 그 속도가 컴퓨터에 비해 아주아주아주아주 느려서 그렇지. -_-)

 

또 다른 한편으로는 다른 질문을 할 수 있다.

사람의 시각 역시 여러가지의 filter로 구성되어 있다. 그 filter set은 무엇인가 -_-

 

분명히, 카메라같은 것을 통해 보지 않고 육안으로 보더라도,

빨리 도는 바퀴가 거꾸로 도는 것 같이 보일 때가 있다.

일단 사람의 시각도 어느 정도 discrete하다는 것이다.

착시현상은 단순한 재미를 위해 연구되는 것이 아니다 -_-...

인간 시각의 filterset에 대한 일종의 리버스 엔지니어링이라고 해야 할까나?

 

인간이 야하다고 느끼는 것은 filter들이 만드는 feature set을 가지고 대뇌가 단순이 classify하는 것일까? 그렇다면 언젠가는 음란물 filter가 인간과 비슷한 정확도로 동작하는 날이 올 것이다 -_-