programing

판다가 인식하는 모든 d타입은 무엇입니까?

bestprogram 2023. 5. 12. 22:46

판다가 인식하는 모든 d타입은 무엇입니까?

판다의 경우, 혹시 다른 데이터 유형이 있다면 누가 알겠습니까?

float64,int64 (의 )np.number맘에 들다float32,int8아래)

(ii)bool

(iii)datetime64,timedelta64

열과 " " " ", " ", " " 를 사용해야 합니다.dtypeobject?

에서 ( ( ( (ii), (iii) 외에.pandas그것을 만들지 않습니다.dtype하나의object?

pandas에dtype 빌니다에서 해당 합니다.numpy이에 대한 자세한 내용은 다음을 참조하십시오.

import pandas as pd

df = pd.DataFrame({'A': [1,'C',2.]})
df['A'].dtype

>>> dtype('O')

type(df['A'].dtype)

>>> numpy.dtype

을 찾을 수 있습니다.numpy.dtypes 설명서에서:

부울의

'b'(서명된) 바이트

'B' 부호 없는 바이트

'i'(서명된) 정수

'u' 부호 없는 정수

'f' 부동 소수점

'c' 복소수점

'm' 시간 델타

'M' 날짜 시간

'O'(파이썬) 객체

'S', 'a' 제로 종단 바이트(권장되지 않음)

'U' 유니코드 문자열

'V' 원시 데이터(보이드)

pandas이러한 유형을 지원해야 합니다. astypepandas.Series입력 인수로 위의 옵션 중 하나를 사용하는 개체입니다.pandas을 변환하려고 Series그런 유형으로(또는 최소한 다시).object 유형;);'u'내가 보는 유일한 것은pandas전혀 이해하지 못함:

df['A'].astype('u')

>>> TypeError: data type "u" not understood

은 이은입니다.numpy오류는 다음과 같은 이유로 발생합니다.'u'항목당 바이트 수를 지정하는 숫자 뒤에 와야 합니다(유효해야 함).

import numpy as np

np.dtype('u')

>>> TypeError: data type "u" not understood

np.dtype('u1')

>>> dtype('uint8')

np.dtype('u2')

>>> dtype('uint16')

np.dtype('u4')

>>> dtype('uint32')

np.dtype('u8')

>>> dtype('uint64')

# testing another invalid argument
np.dtype('u3')

>>> TypeError: data type "u3" not understood

요하자면약,면자▁to,astypepandas사물들은 타당한 주장으로 합리적인 무언가를 시도하고 할 것입니다.numpy.dtype:numpy.dtype('f')는 와동합다니와 .numpy.dtype('float32')그리고.numpy.dtype('f8')는 와동합다니와 .numpy.dtype('float64')등. 주장을 전달하는 것도 마찬가지입니다.pandas astype방법들.

Pandas 문서는 NumPy에서 각 데이터 유형 클래스를 찾기 위해 다음을 권장합니다.

def subdtypes(dtype):
    subs = dtype.__subclasses__()
    if not subs:
        return dtype
    return [dtype, [subdtypes(dt) for dt in subs]]

subdtypes(np.generic)

출력:

[numpy.generic,
 [[numpy.number,
   [[numpy.integer,
     [[numpy.signedinteger,
       [numpy.int8,
        numpy.int16,
        numpy.int32,
        numpy.int64,
        numpy.int64,
        numpy.timedelta64]],
      [numpy.unsignedinteger,
       [numpy.uint8,
        numpy.uint16,
        numpy.uint32,
        numpy.uint64,
        numpy.uint64]]]],
    [numpy.inexact,
     [[numpy.floating,
       [numpy.float16, numpy.float32, numpy.float64, numpy.float128]],
      [numpy.complexfloating,
       [numpy.complex64, numpy.complex128, numpy.complex256]]]]]],
  [numpy.flexible,
   [[numpy.character, [numpy.bytes_, numpy.str_]],
    [numpy.void, [numpy.record]]]],
  numpy.bool_,
  numpy.datetime64,
  numpy.object_]]

판다들은 이 수업들을 유효한 유형으로 받아들입니다.를 들면, 들면를예,dtype={'A': np.float}.

NumPy 문서에는 자세한 정보와 차트가 포함되어 있습니다.

d타입

팬더 1.0.0 출시 이후 2020년 2월 편집

Panda는 대부분 각 시리즈에 대해 NumPy 배열과 dtype을 사용합니다(데이터 프레임은 각각 고유한 dtype을 가질 수 있는 Series의 모음입니다).NumPy의 문서에서는 dtype, 데이터 유형 및 데이터 유형 개체에 대해 자세히 설명합니다.또한 @lcameron05에서 제공하는 답변은 numpyd 유형에 대한 훌륭한 설명을 제공합니다.게다가, 판다 문서에는 많은 추가적인 정보가 있습니다.

판다 개체에 저장된 주요 유형은 float, int, bool, datetime64[ns], time delta[ns] 및 object입니다.또한 이러한 dtype에는 int64 및 int32와 같은 항목 크기가 있습니다.

기본적으로 플랫폼(32비트 또는 64비트)에 관계없이 정수 유형은 int64이고 float 유형은 float64입니다.다음은 모두 int64 dtype이 됩니다.

그러나 Numpy는 어레이를 생성할 때 플랫폼에 종속된 유형을 선택합니다.다음 WILL은 32비트 플랫폼에서 int32를 생성합니다.판다 버전 1.0.0의 주요 변경사항 중 하나는 다음과 같습니다.pd.NA을 나타냅니다(인 스라결이나니다타냅아(값이닌을측칼값전이아(▁of닌▁(▁to다▁values▁the▁missing▁than)가 아닙니다).np.nan,pd.NaT또는None용도에 따라 다름).

Pandas는 NumPy의 유형 시스템을 확장하고 사용자가 확장 유형에 자신의 유형을 작성할 수 있도록 합니다.다음은 모든 판다 확장 유형을 나열한 것입니다.

표준 시간대 처리

데이터 종류: tz 인식 날짜 시간(NumPy는 시간대 인식 날짜 시간을 지원하지 않습니다.)

데이터 유형:날짜/시간TZD 유형

스칼라: 타임스탬프

배열: 배열.날짜/시간배열

문자열 별칭: 'datetime64[ns, ]'

범주형 데이터

데이터 종류: 범주형

데이터 유형: 범주형D 유형

스칼라: (없음)

배열: 범주형

문자열 별칭: 'category'

시간 범위 표현

데이터 종류: 기간(기간)

데이터 유형:기간 D 유형

스칼라: 주기

배열: 배열.기간 배열

문자열 별칭: 'period[]', 'period[]'

희소 데이터 구조

데이터 종류: 희소

데이터 유형: SparseDtype

스칼라: (없음)

배열: 배열.희소 배열

문자열 별칭: 'Sparse', 'Sparse[int], 'Sparse[float]'

간격 색인

데이터 종류: 구간

데이터 유형:간격 D 유형

스칼라: 구간

배열: 배열.구간 배열

문자열 별칭: 'interval', 'Interval[<numpy_dtype>], 'Interval[datetime64[ns,]], 'Interval[timedelta64[]'

null 가능한 정수 데이터 형식

데이터 종류: null 가능 정수

데이터 유형: Int64D 유형, ...

스칼라: (없음)

배열: 배열.정수 배열

문자열 별칭: 'Int8', 'Int16', 'Int32', 'Int64', 'UInt8', 'UInt16', 'UInt32', 'UInt64'

텍스트 데이터 작업

데이터 종류:줄들

데이터 유형:StringDtype

스칼라: str

배열: 배열.문자열 배열

문자열 별칭: 'string'

결측값이 있는 부울 데이터

데이터 종류: 부울(NA 포함)

데이터 유형:BooleanDtype

스칼라: bool

배열: 배열.부울 배열

문자열 별칭: 'boolean'

다른 답들을 바탕으로, 판다들은 또한 그들 자신의 d형들을 포함합니다.

팬더와 타사 도서관은 NumPy의 활자 시스템을 몇 군데 확장합니다.이 섹션은 팬더가 내부적으로 확장한 것에 대해 설명합니다.판다에서 사용할 수 있는 확장자를 직접 작성하는 방법은 확장자 유형을 참조하십시오.확장을 구현한 타사 라이브러리 목록은 확장 데이터 유형을 참조하십시오.

다음 표에는 모든 판다 확장 유형이 나와 있습니다.관련 문서 참조

https://pandas.pydata.org/pandas-docs/stable/user_guide/basics.html#basics-dtypes

--업데이트된 링크--

또한 판다 1.0 기준으로 자체 문자열 d형과 nullable d형이 있습니다.

언급URL : https://stackoverflow.com/questions/29245848/what-are-all-the-dtypes-that-pandas-recognizes