programing

panda.read_excel에서 헤더마다 행 범위 건너뛰기

bestprogram 2023. 4. 17. 22:32

panda.read_excel에서 헤더마다 행 범위 건너뛰기

나는 그 논쟁을 안다.usecolspandas.read_excel()에서는 특정 컬럼을 선택할 수 있습니다.

예를 들어, 엑셀 파일을 읽었습니다.pandas.read_excel()제 엑셀 스프레드시트에는 1161개의 행이 있습니다.첫 번째 행(인덱스 0)을 유지하고 2:337 행을 건너뜁니다.언쟁인 것 같은데skiprows는 인덱스가 0일 때만 작동합니다.여러 가지 방법을 시도했지만 337번째 행이 켜진 후가 아니라 1161번째 행이 모두 읽히는 출력이 항상 코드로 생성됩니다.예를 들어 다음과 같습니다.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "336",
                                        usecols = "H:BD")

다음은 또 다른 시도입니다.

documentationscore_dataframe = pd.read_excel("Documentation Score Card_17DEC2015 Rev 2 17JAN2017.xlsx",
                                        sheet_name = "Sheet1",
                                        skiprows = "1:336",
                                        usecols = "H:BD")

원본 엑셀 Import에서 2행부터 337행까지 데이터 프레임을 제외했으면 합니다.

의 매뉴얼에 따라pandas.read_excel,skiprows목록과 같아야 합니다.

대신 행 1 ~ 336을 제외하려면 다음과 같이 하십시오.

df = pd.read_excel("file.xlsx",
                   sheet_name = "Sheet1",
                   skiprows = range(1, 337),
                   usecols = "H:BD")

주의:range컨스트럭터가 고려되다list예를 들어, 이 목적을 위해 명시적인 목록 변환은 필요하지 않습니다.

함수를 다음 주소로 전달할 수도 있습니다.skiprows=예를 들어 첫 번째 336 행을 건너뛰려면(헤더 행 뒤에 있음) 다음 절차를 수행합니다.

df = pd.read_excel('Book1.xlsx', sheet_name='Sheet1', skiprows=lambda x: 1<=x<=336)

언급URL : https://stackoverflow.com/questions/49801060/skipping-range-of-rows-after-header-through-pandas-read-excel