분류 전체보기 (347) 썸네일형 리스트형 수학과 통계의 개념 수학과 통계는 무슨 관계에 있는가? 파이썬을 배우다보니 확실히 수학적 개념을 많이 맞닥들이게 된다. 파이썬 자체가 수학은 아니지만, 특히 데이터에 대한 일을 하겠다고 했을 때는 그 분야에 대한 지식은 물론, 통계와 수학적 지식이 있어야만 한다. 수학 공부의 필요성을 많이 느끼고 있다. 수학을 좋아했었다고는 하지만, 사실 해외로 나가면서 수학에 대한 감을 많이 잃어버렸다. 공부를 하지 않아도 좋은 점수를 받을 수 있었으니 말이다. 좀 아쉬운 부분이다. 1. 통계란 무엇인가? 통계는 데이터 수집, 분석, 설명 및 표시와 관련이 있는 학문이다. 완전하지 않은 정보를 통해서 결과를 예측하는데 도움을 준다. 예측이 필요한 시장이나 비즈니스, 건강, 정부 부서 등 필요로 하는 곳이 많다. 즉, 통계는 데이터의 품질.. 파이썬으로 트위터 스크랩하기 1. 파이썬으로 트위터 스크랩하기 한국에서는 뜸하기는 하지만, 트위터는 현재 전세계에서 가장 유명한 소셜네트워크 플랫폼이라고 할 수 있을 것이다. 그래서 데이터 과학자들은 트위터를 이용해서 다양한 분석을 진행하기도 한다. 비즈니스와 연구 어느 쪽에도 활용될 수가 있다. 트위터 상의 대화가 생체리듬을 나타낼 수 있다.(뉴욕타임즈 링크) 금융 전문가들은 트위터를 이용해서 주가를 예측한다. 트위터의 위치 정보를 활용하여 "번개"가 친 곳을 지도에 표시한다. 이러한 귀중한 정보를 그냥 흘려보내기는 참 아깝다. 이번에는 파이썬으로 트위터 스크랩하는 방법을 알아보도록 하자. 2. 트위터 API API란 애플리케이션 프로그래밍 인터페이스의 약자로, 프로그램들이 서로 상호작용을 하는 것을 도와주는 매개체라고 할 수 있.. API란? API란 애플리케이션 프로그래밍 인터페이스의 약자로, 프로그램들이 서로 상호작용을 하는 것을 도와주는 매개체라고 할 수 있다. 1. API는 서버와 데이터베이스의 출입구다. 데이터베이스에는 귀한 정보가 저장되어 있는 곳이기 때문에 아무나 접근하지 못하도록 API는 허용된 사람들에게만 접근성을 부여한다. 2. API는 애플리케이션과 기기가 원활하게 통신하도록 한다. 3. API는 모든 접속을 표준화시킨다. API는 모든 접속을 표준화시키기 때문에 기계나 OS에 상관없이 누구나 동일한 엑세스를 얻을 수 있게 된다. 티스토리에 TOC(Table of Contents) 목차 만들기 Toc (Table of Content)가 있다면 전체 포스트의 내용을 한눈에 볼 수 있을 뿐만 아니라, 클릭 한번으로 해당 위치로 이동할 수 있습니다. 자동으로 Toc를 생성해주는 여러가지 오픈소스 라이브러리가 있습니다. Toc 라이브러리중 Tocbot를 Tistory에 적용하는 방법을 소개합니다. 1. 준비 https://tscanlin.github.io/tocbot/ 2. script, css CDN 적용 바로 위에 아래 코드를 붙여 넣는다. html 3. toc가 표시될 div 추가 본문이 시작되는 부분에 넣습니다. poster 스킨 기준 를 찾아 그 아래에 붙여 넣으면 됩니다. html 4. script 작성 바로 위에 아래 script 작성. html 5. css 수정 CSS버튼을 눌러서 CS.. 데이터 엔지니어 로드맵 과거 학창 시절에는 공부라는 것이 중학교, 고등하교, 대학교를 나오면 끝나는 것이라고 막연하게 생각을 했었다. 하지만 업무를 하고 자신이 배우고 싶은 것에는 끝이 없듯이, 정말로 배움에는 끝이라는 것이 없다. 다만 방향과 목표가 있을 뿐이다. 그래서 어떤 것을 배우려고 하든, 나아가려고 하든지 먼저 자신이 가고자 하는 곳이 어디인지를 정확하게(혹은 어렴풋이라도) 알고나서 그 여행을 떠나는 것이 깊은 배움을 하기 위한 초석이 될 것이다. 2021년 12월 21일 데이터 엔지니어가 되어야겠다는 마음을 먹은 뒤로, 내가 하고 싶은 일을 하기 위해서 따라야할 로드맵을 어떻게 그려야 할까를 계속 고민했다. 데이터라는 분야에서도 일은 상당히 다양하게 나뉜다. 여기에서 내가 알아본 각자의 역할을 모두 다 설명할 수는.. 티스토리 단축키 Ctrl / 를 누르면 티스토리에서 단축키 목록이 나온다. 굵게 Ctrl B 서체 변경 Ctrl Alt T 링크 삽입 Ctrl K 기울임꼴 Ctrl I 제목 변경 Ctrl Alt 1 코드 블럭 Ctrl Alt , 밑줄 Ctrl U 본문 변경 Ctrl Alt 2 특수 문자 Ctrl Alt . 취소선 Ctrl Alt J 인용 변경 Ctrl Alt 3 이모티콘 Ctrl Alt E 글자색 Ctrl Alt [ 목록 변경 Ctrl Alt 4 단축키 목록 Ctrl / 배경색 Ctr lAlt ] 정렬 Ctrl Alt 5 파이썬과 씨름하기 파이썬에서 한 기능이 되지 않는 것 때문에 하루종일 고민하고 씨름을 하다보니, 생각보다 이 녀석들과 친해진 것 같다. pip를 설치를 했는데도 라이브러리가 import가 안되는 것 때문에 파이썬을 지웠다 다시 다운로드했다가, PATH를 옮겼다가, 버전을 지웠다가, 커멘드에서 온갖 sudo를 남발했다. 그 과정에서 StackOverFlow에 많은 질문을 올렸고, 어떤 식으로 문제를 해결해나갈 수 있는 지를 배웠다. 어떤 일이든 그렇지만, 내가 원하는 것처럼 단숨에 답을 내줄 수 있는 사람은 없다. 오로지 믿을 것은 검색력과 커뮤니티에 지속적으로 내 문제 해결을 적극적으로 해결하려고 하는 노력이 지속되는 것 밖에는 없다. 최종적으로는 레딧에서 힌트를 얻고, VScode가 가상환경에서 돌아가고 있는 것이라, .. 파이썬 기본 개념 - 식별자 기본 개념 중에 대부분 당연히 이해가 되는 것들은 기록할 필요를 느끼지 못하는데, 식별자의 경우는 조금 암기를 해야 할 것 같아서 적어놓는다. 식별자에 공백 없는 경우 단어 사이 언더바( _ _ 붙인 경우 단어 첫번째 글자 대문자 itemlist item_list ItemList - Snake Case: 언더바( _ )를 중간 기호에 사용하는 방법 - Camel Case: 단어 첫 글자를 대문자로 만드는 방법 구분 내용 예 클래스 대문자로 시작, Camel Case 사용 GetData 함수 또는 변수 소문자로 시작, Snake Case 사용 뒤에 괄호 붙으면 함수를 의미 print() 뒤에 괄호 없으면 변수를 의미 pi 이전 1 ··· 39 40 41 42 43 44 다음