python 78

Pandas/NumPy에서 열/변수가 숫자인지 여부를 확인하는 방법은 무엇입니까?

Pandas/NumPy에서 열/변수가 숫자인지 여부를 확인하는 방법은 무엇입니까? 변수가 다음에 있는지 여부를 확인할 수 있는 더 나은 방법이 있습니까?Pandas및/또는NumPy이라numeric아니면 안 되나요? 나는 정의된 자아가 있습니다.dictionary와 함께dtypes열쇠로numeric/not가치로서인pandas 0.20.2할 수 있는 일: import pandas as pd from pandas.api.types import is_string_dtype from pandas.api.types import is_numeric_dtype df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': [1.0, 2.0, 3.0]}) is_string_dtype(df['A']) ..

programing 2023.07.16

파이썬에서 이미지의 exif 데이터를 읽으려면 어떻게 해야 합니까?

파이썬에서 이미지의 exif 데이터를 읽으려면 어떻게 해야 합니까? PIL을 사용하고 있습니다.사진의 EXIF 데이터를 사전으로 변환하려면 어떻게 해야 합니까?사용할 수 있습니다._getexif()PIL 이미지의 보호된 방법입니다. import PIL.Image img = PIL.Image.open('img.jpg') exif_data = img._getexif() 이렇게 하면 EXIF 숫자 태그로 색인화된 사전이 제공됩니다.사전을 실제 EXIF 태그 이름 문자열로 인덱싱하려면 다음과 같은 방법을 사용하십시오. import PIL.ExifTags exif = { PIL.ExifTags.TAGS[k]: v for k, v in img._getexif().items() if k in PIL.ExifTags...

programing 2023.07.16

판다 데이터 프레임에서 범주형 데이터 변환

판다 데이터 프레임에서 범주형 데이터 변환 다음 유형의 데이터가 있는 데이터 프레임이 있습니다(열이 너무 많습니다). col1 int64 col2 int64 col3 category col4 category col5 category 열은 다음과 같습니다. Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] 각 열의 모든 값을 다음과 같이 정수로 변환합니다. [1, 2, 3, 4, 5, 6, 7, 8] 이를 통해 한 열에 대해 다음과 같이 해결했습니다. dataframe['c'] = pandas.Categorical.from_array(dataframe.col3).codes 이제 데이터 프레임에 오래된 두 개의 열이 있습..

programing 2023.07.16

파이썬에서 모든 크기의 빈 목록을 얻으려면 어떻게 해야 합니까?

파이썬에서 모든 크기의 빈 목록을 얻으려면 어떻게 해야 합니까? 기본적으로 C:에서 이 어레이와 동등한 파이썬을 원합니다. int a[x]; 하지만 파이썬에서 나는 다음과 같은 배열을 선언합니다. a = [] 문제는 다음과 같은 값을 가진 임의 슬롯을 할당한다는 것입니다. a[4] = 1 하지만 파이썬 목록이 비어 있기 때문에 파이썬으로는 그렇게 할 수 없습니다(길이 0)."array"가 실제로 Python 목록을 의미하는 경우, a = [0] * 10 또는 a = [None] * 10 파이썬에서 원하는 것을 정확히 할 수 없습니다(제가 제대로 읽는다면).목록의 각 요소(또는 배열)에 대한 값을 입력해야 합니다. 하지만 다음을 시도해 보십시오. a = [0 for x in range(N)] # N = s..

programing 2023.07.16

텍스트를 어떻게 문장으로 나눌 수 있습니까?

텍스트를 어떻게 문장으로 나눌 수 있습니까? 저는 텍스트 파일을 가지고 있습니다.저는 문장 목록을 받아야 합니다. 어떻게 구현할 수 있습니까?약어로 점을 사용하는 등 미묘한 점들이 많습니다. 내 예전 규칙적인 표현은 잘 작동하지 않습니다. re.compile('(\. |^|!|\?)([A-Z][^;↑\.@\^&/\[\]]*(\.|!|\?) )',re.M) Natural Language Toolkit(nltk.org )에는 필요한 기능이 있습니다.이 그룹 게시는 다음과 같은 작업을 수행함을 나타냅니다. import nltk.data tokenizer = nltk.data.load('tokenizers/punkt/english.pickle') fp = open("test.txt") data = fp.read..

programing 2023.07.16

glob.glob 모듈을 사용하여 하위 폴더를 검색하려면 어떻게 해야 합니까?

glob.glob 모듈을 사용하여 하위 폴더를 검색하려면 어떻게 해야 합니까? 이 질문에는 이미 다음과 같은 답이 있습니다. 파일을 재귀적으로 찾는 방법은 무엇입니까? (28개 답변) 마감됨2년 전에. 폴더에서 일련의 하위 폴더를 열고 텍스트 파일을 찾아 텍스트 파일의 줄을 인쇄합니다.사용 중: configfiles = glob.glob('C:/Users/sam/Desktop/file1/*.txt') 그러나 하위 폴더에도 액세스할 수 없습니다.동일한 명령을 사용하여 하위 폴더에도 액세스할 수 있는 방법을 아는 사람이 있습니까? 3 Python 3.5를 합니다.**/기능: configfiles = glob.glob('C:/Users/sam/Desktop/file1/**/*.txt', recursive=Tr..

programing 2023.07.16

Python/NumPy 목록에서 Nan을 제거하는 방법

Python/NumPy 목록에서 Nan을 제거하는 방법 값이 포함된 목록이 있는데, 받은 값 중 하나는 'nan'입니다. countries= [nan, 'USA', 'UK', 'France'] 제거하려고 했지만 매번 오류가 발생합니다. cleanedList = [x for x in countries if (math.isnan(x) == True)] TypeError: a float is required 내가 이걸 시도했을 때: cleanedList = cities[np.logical_not(np.isnan(countries))] cleanedList = cities[~np.isnan(countries)] TypeError: ufunc 'isnan' not supported for the input typ..

programing 2023.07.16

판다의 루프를 위한 것이 정말 나쁜가요?언제가 좋을까요?

판다의 루프를 위한 것이 정말 나쁜가요?언제가 좋을까요? for루프가 정말 "나쁘다"?그렇지 않다면 어떤 상황에서 기존의 "벡터화된"1 접근 방식을 사용하는 것보다 더 나을까요? 저는 "벡터화"의 개념과 판다가 어떻게 벡터화된 기술을 사용하여 계산 속도를 높이는지 잘 알고 있습니다.벡터화된 기능은 전체 시리즈 또는 DataFrame에 걸쳐 작업을 브로드캐스트하여 기존의 데이터 반복보다 훨씬 빠른 속도를 달성합니다. (Stack Overflow에 ▁using▁however▁(스▁that▁solutions)를 사용하여 데이터를 순환하는 문제에 대한 을 제공하는 놀랐습니다.for루프 및 목록 이해.설명서와 API에 따르면 루프는 "나쁘다"며 어레이, 시리즈 또는 DataFrames를 "절대" 반복해서는 안 됩..

programing 2023.07.16

장고 쿼리 세트를 딕트 목록으로 변환하려면 어떻게 해야 합니까?

장고 쿼리 세트를 딕트 목록으로 변환하려면 어떻게 해야 합니까? 장고를 변환하려면 어떻게 해야 합니까?QuerySet의 상태가.list의dicts? 이에 대한 답을 찾지 못해서 모두가 사용하는 공통 도우미 기능이 빠진 것은 아닌지 궁금합니다.방법을 사용합니다. >>> Blog.objects.values() [{'id': 1, 'name': 'Beatles Blog', 'tagline': 'All the latest Beatles news.'}], >>> Blog.objects.values('id', 'name') [{'id': 1, 'name': 'Beatles Blog'}] 참고: 결과는 다음과 같습니다.QuerySet대부분의 행동은 a처럼 행동합니다.list하지만 실제로는 의 사례가 아닙니다.list..

programing 2023.07.06

판다를 사용하여 둘 이상의 최대 열 찾기

판다를 사용하여 둘 이상의 최대 열 찾기 열이 있는 데이터 프레임이 있습니다.A,B열을 만들어야 합니다.C모든 레코드/행에 대해 다음과 같이 설정합니다. C = max(A, B). 어떻게 하면 좋을까요?다음과 같은 최대값을 얻을 수 있습니다. >>> import pandas as pd >>> df = pd.DataFrame({"A": [1,2,3], "B": [-2, 8, 1]}) >>> df A B 0 1 -2 1 2 8 2 3 1 >>> df[["A", "B"]] A B 0 1 -2 1 2 8 2 3 1 >>> df[["A", "B"]].max(axis=1) 0 1 1 8 2 3 그래서: >>> df["C"] = df[["A", "B"]].max(axis=1) >>> df A B C 0 1 -2 1 ..

programing 2023.07.06