판다가 인식하는 모든 d타입은 무엇입니까?
판다의 경우, 혹시 다른 데이터 유형이 있다면 누가 알겠습니까?
float64
,int64
(의 )np.number
맘에 들다float32
,int8
아래)
(ii)bool
(iii)datetime64
,timedelta64
열과 " " " ", " ", " " 를 사용해야 합니다.dtype
object
?
에서 ( ( ( (ii), (iii) 외에.pandas
그것을 만들지 않습니다.dtype
하나의object
?
pandas
에dtype 빌니다에서 해당 합니다.numpy
이에 대한 자세한 내용은 다음을 참조하십시오.
import pandas as pd
df = pd.DataFrame({'A': [1,'C',2.]})
df['A'].dtype
>>> dtype('O')
type(df['A'].dtype)
>>> numpy.dtype
을 찾을 수 있습니다.numpy.dtypes
설명서에서:
부울의
'b'(서명된) 바이트
'B' 부호 없는 바이트
'i'(서명된) 정수
'u' 부호 없는 정수
'f' 부동 소수점
'c' 복소수점
'm' 시간 델타
'M' 날짜 시간
'O'(파이썬) 객체
'S', 'a' 제로 종단 바이트(권장되지 않음)
'U' 유니코드 문자열
'V' 원시 데이터(보이드)
pandas
이러한 유형을 지원해야 합니다. astype
의 pandas.Series
입력 인수로 위의 옵션 중 하나를 사용하는 개체입니다.pandas
을 변환하려고 Series
그런 유형으로(또는 최소한 다시).object
유형;);'u'
내가 보는 유일한 것은pandas
전혀 이해하지 못함:
df['A'].astype('u')
>>> TypeError: data type "u" not understood
은 이은입니다.numpy
오류는 다음과 같은 이유로 발생합니다.'u'
항목당 바이트 수를 지정하는 숫자 뒤에 와야 합니다(유효해야 함).
import numpy as np
np.dtype('u')
>>> TypeError: data type "u" not understood
np.dtype('u1')
>>> dtype('uint8')
np.dtype('u2')
>>> dtype('uint16')
np.dtype('u4')
>>> dtype('uint32')
np.dtype('u8')
>>> dtype('uint64')
# testing another invalid argument
np.dtype('u3')
>>> TypeError: data type "u3" not understood
요하자면약,면자▁to,astype
의 pandas
사물들은 타당한 주장으로 합리적인 무언가를 시도하고 할 것입니다.numpy.dtype
:numpy.dtype('f')
는 와동합다니와 .numpy.dtype('float32')
그리고.numpy.dtype('f8')
는 와동합다니와 .numpy.dtype('float64')
등. 주장을 전달하는 것도 마찬가지입니다.pandas
astype
방법들.
Pandas 문서는 NumPy에서 각 데이터 유형 클래스를 찾기 위해 다음을 권장합니다.
def subdtypes(dtype):
subs = dtype.__subclasses__()
if not subs:
return dtype
return [dtype, [subdtypes(dt) for dt in subs]]
subdtypes(np.generic)
출력:
[numpy.generic,
[[numpy.number,
[[numpy.integer,
[[numpy.signedinteger,
[numpy.int8,
numpy.int16,
numpy.int32,
numpy.int64,
numpy.int64,
numpy.timedelta64]],
[numpy.unsignedinteger,
[numpy.uint8,
numpy.uint16,
numpy.uint32,
numpy.uint64,
numpy.uint64]]]],
[numpy.inexact,
[[numpy.floating,
[numpy.float16, numpy.float32, numpy.float64, numpy.float128]],
[numpy.complexfloating,
[numpy.complex64, numpy.complex128, numpy.complex256]]]]]],
[numpy.flexible,
[[numpy.character, [numpy.bytes_, numpy.str_]],
[numpy.void, [numpy.record]]]],
numpy.bool_,
numpy.datetime64,
numpy.object_]]
판다들은 이 수업들을 유효한 유형으로 받아들입니다.를 들면, 들면를예,dtype={'A': np.float}
.
NumPy 문서에는 자세한 정보와 차트가 포함되어 있습니다.
팬더 1.0.0 출시 이후 2020년 2월 편집
Panda는 대부분 각 시리즈에 대해 NumPy 배열과 dtype을 사용합니다(데이터 프레임은 각각 고유한 dtype을 가질 수 있는 Series의 모음입니다).NumPy의 문서에서는 dtype, 데이터 유형 및 데이터 유형 개체에 대해 자세히 설명합니다.또한 @lcameron05에서 제공하는 답변은 numpyd 유형에 대한 훌륭한 설명을 제공합니다.게다가, 판다 문서에는 많은 추가적인 정보가 있습니다.
판다 개체에 저장된 주요 유형은 float, int, bool, datetime64[ns], time delta[ns] 및 object입니다.또한 이러한 dtype에는 int64 및 int32와 같은 항목 크기가 있습니다.
기본적으로 플랫폼(32비트 또는 64비트)에 관계없이 정수 유형은 int64이고 float 유형은 float64입니다.다음은 모두 int64 dtype이 됩니다.
그러나 Numpy는 어레이를 생성할 때 플랫폼에 종속된 유형을 선택합니다.다음 WILL은 32비트 플랫폼에서 int32를 생성합니다.판다 버전 1.0.0의 주요 변경사항 중 하나는 다음과 같습니다.
pd.NA
을 나타냅니다(인 스라결이나니다타냅아(값이닌을측칼값전이아(▁of닌▁(▁to다▁values▁the▁missing▁than)가 아닙니다).np.nan
,pd.NaT
또는None
용도에 따라 다름).
Pandas는 NumPy의 유형 시스템을 확장하고 사용자가 확장 유형에 자신의 유형을 작성할 수 있도록 합니다.다음은 모든 판다 확장 유형을 나열한 것입니다.
데이터 종류: tz 인식 날짜 시간(NumPy는 시간대 인식 날짜 시간을 지원하지 않습니다.)
스칼라: 타임스탬프
문자열 별칭: 'datetime64[ns, ]'
데이터 종류: 범주형
데이터 유형: 범주형D 유형
스칼라: (없음)
배열: 범주형
문자열 별칭: 'category'
데이터 종류: 기간(기간)
데이터 유형:기간 D 유형
스칼라: 주기
문자열 별칭: 'period[]', 'period[]'
데이터 종류: 희소
데이터 유형: SparseDtype
스칼라: (없음)
문자열 별칭: 'Sparse', 'Sparse[int], 'Sparse[float]'
데이터 종류: 구간
데이터 유형:간격 D 유형
스칼라: 구간
문자열 별칭: 'interval', 'Interval[<numpy_dtype>], 'Interval[datetime64[ns,]], 'Interval[timedelta64[]'
데이터 종류: null 가능 정수
데이터 유형: Int64D 유형, ...
스칼라: (없음)
문자열 별칭: 'Int8', 'Int16', 'Int32', 'Int64', 'UInt8', 'UInt16', 'UInt32', 'UInt64'
데이터 종류:줄들
데이터 유형:StringDtype
스칼라: str
문자열 별칭: 'string'
데이터 종류: 부울(NA 포함)
데이터 유형:BooleanDtype
스칼라: bool
문자열 별칭: 'boolean'
다른 답들을 바탕으로, 판다들은 또한 그들 자신의 d형들을 포함합니다.
팬더와 타사 도서관은 NumPy의 활자 시스템을 몇 군데 확장합니다.이 섹션은 팬더가 내부적으로 확장한 것에 대해 설명합니다.판다에서 사용할 수 있는 확장자를 직접 작성하는 방법은 확장자 유형을 참조하십시오.확장을 구현한 타사 라이브러리 목록은 확장 데이터 유형을 참조하십시오.
다음 표에는 모든 판다 확장 유형이 나와 있습니다.관련 문서 참조
https://pandas.pydata.org/pandas-docs/stable/user_guide/basics.html#basics-dtypes
--업데이트된 링크--
또한 판다 1.0 기준으로 자체 문자열 d형과 nullable d형이 있습니다.
언급URL : https://stackoverflow.com/questions/29245848/what-are-all-the-dtypes-that-pandas-recognizes
'programing' 카테고리의 다른 글
GUID가 GUID인지 확인하는 방법 (0) | 2023.05.12 |
---|---|
Postgre에서 UTC의 현재 시간을 기본값으로 사용SQL (0) | 2023.05.12 |
도커화된 Postgre 백업/복원SQL 데이터베이스 (0) | 2023.05.12 |
nvm을 사용하여 Node.js 버전을 변경하는 방법 (0) | 2023.05.12 |
Git 원격 'push to' 기본값 변경 (0) | 2023.05.12 |