sitelink1 | |
---|---|
sitelink2 | |
sitelink3 | |
sitelink4 | |
sitelink5 | |
extra_vars6 |
소켓통신으로 naver.com 80 포트로 접속한 후
GET HTTP/1.0 /index.htmrnrn
rn
을 날리면
Host: naver.com
User-Agent: Exlploer
Content-Type: text/html
Content-Length: 10234
<html><title>naver.com</title> .....
이 날라옵니다.
위의 예제는 아주 단순한 경우이며
실제 브라우져는 위와 같은 텍스트 형식으로 쿠키, 세션, 브라우져의 정보 등을 같이 보냅니다.
서버또한 단순히 html만 보내는 것이 아니라
naver.com 의 웹서버가 뭔지, OS는 linux 인지, Unix 인지 version은 어떻게되는지 등 자질구레한 정보등을 같이 보냅니다.
따라서 http protocol 을 알면 html 페이지는 필요 없고 naver.com 의 웹서버는 무엇인지 알려달라는 코드를 보내면
웹서버는 해당하는 정보만 보냅니다.
즉, naver.com/box/ 밑에 있는 파일과 디렉토리 목록을 보내달라는 정보를 보내면
웹서버는 친절하게도 그 안의 (윈도우즈의 폴더보기와 같은)목록정보를 보내줍니다.
따라서 목록을 받아 for 문을 돌려 디렉토리이면 또 하위디렉토리 정보를 요청하고
이미지등의 파일이면 요청하면 데이타를 다 보내줍니다.
그러나 사용서버의 경우 보안상 막아놓았기 때문에 DirectoryIndex 정보를 요청하면 거절합니다. ㅡ.ㅜ
더욱 중요한 것은 웹서비스는 실제디렉토리와 URL이 일치하지 않는 경우가 허다합니다.
즉 http://naver.com/blog.do 라는 URL을 요청했을 때
naver.com 의 웹디렉토리 blog.do 라는 파일이 없을 확률이 매우 높습니다.
따라서 Source Backup 이라면 해당서버에 ftp로 접속하셔서 받는 것이 확실하고
Web Service를 위한 것이라면 proxy 서버를 구성하는 것과 같은데 이는 매우 힘들고 험난한 작업이 될 것입니다.
GET HTTP/1.0 /index.htmrnrn
rn
을 날리면
Host: naver.com
User-Agent: Exlploer
Content-Type: text/html
Content-Length: 10234
<html><title>naver.com</title> .....
이 날라옵니다.
위의 예제는 아주 단순한 경우이며
실제 브라우져는 위와 같은 텍스트 형식으로 쿠키, 세션, 브라우져의 정보 등을 같이 보냅니다.
서버또한 단순히 html만 보내는 것이 아니라
naver.com 의 웹서버가 뭔지, OS는 linux 인지, Unix 인지 version은 어떻게되는지 등 자질구레한 정보등을 같이 보냅니다.
따라서 http protocol 을 알면 html 페이지는 필요 없고 naver.com 의 웹서버는 무엇인지 알려달라는 코드를 보내면
웹서버는 해당하는 정보만 보냅니다.
즉, naver.com/box/ 밑에 있는 파일과 디렉토리 목록을 보내달라는 정보를 보내면
웹서버는 친절하게도 그 안의 (윈도우즈의 폴더보기와 같은)목록정보를 보내줍니다.
따라서 목록을 받아 for 문을 돌려 디렉토리이면 또 하위디렉토리 정보를 요청하고
이미지등의 파일이면 요청하면 데이타를 다 보내줍니다.
그러나 사용서버의 경우 보안상 막아놓았기 때문에 DirectoryIndex 정보를 요청하면 거절합니다. ㅡ.ㅜ
더욱 중요한 것은 웹서비스는 실제디렉토리와 URL이 일치하지 않는 경우가 허다합니다.
즉 http://naver.com/blog.do 라는 URL을 요청했을 때
naver.com 의 웹디렉토리 blog.do 라는 파일이 없을 확률이 매우 높습니다.
따라서 Source Backup 이라면 해당서버에 ftp로 접속하셔서 받는 것이 확실하고
Web Service를 위한 것이라면 proxy 서버를 구성하는 것과 같은데 이는 매우 힘들고 험난한 작업이 될 것입니다.