Python

    피어슨 상관 계수

    상관계수 연관성에 대하여 표현해주는 것 아래 파이썬 코드는 OREILLY에 "집단지성 프로그래밍"에서 발췌 Parameter v1 : 데이터 1 v2 : 데이터 2 prefs : 데이터세트 def - p1과 p2에 대한 피어슨 상관 계수를 리턴 def sim_pearson(prefs, p1, p2): si = {} for item in prefs[p1]: for item in prefs[p2]: si[item] = 1 # 공통 요소의 개수를 구함, 없으면 종료 n = len(si) if n==0 return 0 # 모든 선호도를 합산함 sum1 = sum([prefs[p1][it] for it in si]) sum2 = sum([prefs[p2][it] for it in si]) # 제곱의 합을 계산 s..

    [Python] 한글 처리

    # -*- coding: 949 -*- # -*- coding: euc-kr -*-

    [Python] 사전(Dictionary)

    사전 자료형 키 : 값의 쌍, 중괄호를 이용 # 빈 dictionary 정의 a={} # dog 키에 bark 값 입력 a['dog']='bark' a['cat']='cat' # 키에 의한 값 찾기 a['dog'] a['cat'] * 축약형 dictionary a = {'dog' : 'bark', 'cat' : 'meow'} 요소쌍 삭제 del a['dog'] * key , value를 각각 리스트로 저장 family = {'boy':'David', 'girl':'Eliza', 'baby':'Erasmus'} .keys() key들을 리스트로 리턴 .values() 값들을 리스트로 리턴 key 검색 has_key() : 사전에 어떤 키가 있는지? 있으면 1, 없으면 0 family.has_key('boy..

    [Python] 튜플(Tuple) : 한 벌이란 뜻

    여러 개의 연속 수 나열의 대응관계를 지정(?) 컴마(,)를 통해 튜플 지정이 됨 여러 변수 동시 지정 (a,b)=(1,2) ==> a=1b=2 와 같다. SWAP c, d = d, c 튜플과 리스트를 상호전환 (1) p = (1, 2, 3) q = list(p) (2) r = tuple(q)

    [Python] 리스트

    len 요소 수 range 범위에 위한 리스트 생성 a=range(2,7) => [2, 3, 4, 5, 6] a=range(5) => [0,1,2,3,4] append 요소 추가 : append 메소드, 맨뒤에 추가 remove * 특정 요소 삭제 : a.remove('a') => [‘b','c','d'] del 위치에 따른 요소 삭제 : del 명령 a=[1,3,5,7] 일때 del a[2] ==> [1, 3, 7] sort 소트 다차원 리스트 orders = ['potato', ['pizza', 'Coke', 'salad'], 'hamburger']

    [Python] 문자열 처리

    기본적으로 list 사용법에 준함 >>> x[1:3] #1번이상 3번‘미만’ 'bc' >>> x[:3] #처음부터 3번‘미만’까지 'abc' >>> x[3:] #3번‘이후’부터 끝까지 'def' banana => nanana >>> x = 'n' + x[1:] # ‘n' + 1번 이후까지 >>> x 'nanana'

    [Python] 함수

    1. 일반 함수 def (,,...) : * 정의 완료시 한줄 뗌, return 문을 만나면 함수 탈출 * 함수 정의는 호출 뒤에 해도 됨, * 함수의 정의와 선언이 한꺼번에 이루어짐. 2. 인라인 함수 - lambda (lambda ,...:) (,) >>>(lambda x,y: x+y)(10, 20) 30 3. map 함수 : lambda 함수에 리스트를 적용 : 함수에 리스트를 적용 리스트로 리턴 map(lambda x: x**2, range(5)) [0, 1, 4, 9, 16] 4. reduce 함수 : lamda 함수에 리스트를 적용하여 누적 결과 표시 : 누적적용 수 리턴 >>> reduce(lambda x,y: x+y, [0,1,2,3,4]) 10 >>> reduce(lambda x,y: y..

    [Python] 기본 문법

    대소문자를 구별함 확장자 : py 실행 파일로 컴파일 : py2exe 툴을 사용하여 컴파일 (별도 다운로드 해야 함) 연산자 + - * / %, x**2 = x의 제곱 주석 # 자료형 1. 수치형(numbers) 1) int : -21억 ~ +21 억 (32bit) 2) long int : +-922경(9.2*10^18,64bit) , 표기 : 접미사 L (예: 216800L) 3) float : 부동소숫점 수 2. 순서형(sequence) : 1) 문자열(string) : 홑따옴표와 겹따옴표를 모두 사용 가능 특수문자, 따옴표는 / 와 함께 입력 (예: /n 줄바꿈, /“ 따옴표 표시) 2) 리스트(list) : 대괄호([]) 사용, 엔티티의 집합, 예) a=[1,2,3,4,5] 3) 튜플(tuple)..