메시리
501
2019-07-12 00:22:32
3
164

파싱질문입니다.!!


해외,국내 등 축구관련 파싱을 하려고 하는데요

파싱해서 전적, 선수단, 승률 등 기능을 만들어 보려고 합니다.


질문1.

보통은 파이썬을 많이 쓰는 것 같은데 파이썬을 쓰는 이유가 따로 있나요?? 

자바의 jsoup도 쓰는 것 같은데 아무래도 외부 파싱은 파이선으로 하는 것 같더라구요.

(외부파싱 : 다른 웹 사이트에서 가져오는 데이터, 

 내부파싱 : 나의 웹 사이트의 내용을 파싱이라고 저는 정의 했는데... )

질문2.

파이썬을 사용한다면 저는 자바 스프링으로 웹 개발을 할건데 보통 연동해서 사용을 하는 것 같은데 맞나오?? 파싱만 파이썬으로 나머지는 자바로! 이런 식으로요

질문3.

예를들어 전적을 가져오고 승률 구해 전적과 승률을 화면에 뿌린다!! 라고 하면 하루에 한번만 파싱을 돌리고(파싱할 사이트의 정보 업데이터가 하루에 1회라고 가정), 파싱한 데이터를 db에 넣어서 다음부터는 db에서 가져와서 사용을 해야하나요?

아니면 매번 조회할 때 마다 파싱을 해야 하나요?


상황에 따라 다르다는 점 알지만, 비교적 좋은 방법을 알고 싶어서 질문 올립니다.

그 상황에 맞는게 무엇인지 잘몰라서요 ㅜㅜ

이상입니다. !! 


0
0
  • 답변 3

  • rvo
    102
    2019-07-12 01:32:20

    1. 이거이거 파싱하는데 이 반드시 이 파이선한다 식의 특별한 이유는 없습니다. 생산성이 좋다 등등 같이 언어 자체 이유가 대부분일 것입니다.

    2. 폴리글랏도 불가능하진 않지만 굳이 복잡성을 높이실 이유가 있지 않으면 전 안합니다.

    3. 원하시는 방식으로 하시면 됩니다. "비교적" "좋은" 방법은 말 자체로도 그리고 의미적으로도 잘 정의되지 않습니다.


    문제 탐색 방법 중 하나로 무작정 해보기가 있습니다. 제가 많이 쓰는 방법입니다. 단순 무식한 방법 같지만 몇 번 해보면 꽤 괜찮습니다. 왜냐하면 사람들이 대개 똘똘하지 않아서 그렇지 무작정 해보기는 메타 인지를 수반하는 굉장히 어려운 작업입니다.

    0
  • lloydkwon
    2k
    2019-07-12 08:44:13
    3. db에 파싱한 정보를 집어넣고 ( 이 부분은 batch 를 이용해서 처리하구요.) db에서 조회하는게 좋다고 생각됩니다...
    0
  • 메시리
    501
    2019-07-12 21:30:02
    감사합니다 참고하겠습니다!!
    0
  • 로그인을 하시면 답변을 등록할 수 있습니다.