목록에 포함된 판다 데이터 프레임

programing

목록에 포함된 판다 데이터 프레임

newsource 2023. 6. 9. 22:04

목록에 포함된 판다 데이터 프레임

목록 목록을 판다 데이터 프레임으로 쉽게 변환할 수 있습니다.

import pandas as pd
df = pd.DataFrame([[1,2,3],[3,4,5]])

하지만 어떻게 목록 목록으로 되돌릴 수 있습니까?

lol = df.what_to_do_now?
print lol
# [[1,2,3],[3,4,5]]

기본 어레이에 액세스하여 이 어레이를 호출할 수 있습니다.tolist방법:

>>> df = pd.DataFrame([[1,2,3],[3,4,5]])
>>> lol = df.values.tolist()
>>> lol
[[1L, 2L, 3L], [3L, 4L, 5L]]

데이터에 보존할 열 및 인덱스 레이블이 있는 경우 몇 가지 옵션이 있습니다.

예제 데이터:

>>> df = pd.DataFrame([[1,2,3],[3,4,5]], \
       columns=('first', 'second', 'third'), \
       index=('alpha', 'beta')) 
>>> df
       first  second  third
alpha      1       2      3
beta       3       4      5

그tolist()다른 답변에 설명된 방법은 유용하지만 핵심 데이터만 생성하므로 필요에 따라 충분하지 않을 수 있습니다.

>>> df.values.tolist()
[[1, 2, 3], [3, 4, 5]]

한 가지 접근 방식은 다음을 변환하는 것입니다.DataFrame사용 중인 jsondf.to_json()그리고 다시 해석합니다.이것은 번거롭지만 몇 가지 장점이 있습니다, 왜냐하면to_json()메소드에는 몇 가지 유용한 옵션이 있습니다.

>>> df.to_json()
{
  "first":{"alpha":1,"beta":3},
  "second":{"alpha":2,"beta":4},"third":{"alpha":3,"beta":5}
}

>>> df.to_json(orient='split')
{
 "columns":["first","second","third"],
 "index":["alpha","beta"],
 "data":[[1,2,3],[3,4,5]]
}

번거롭지만 유용할 수 있습니다.

좋은 소식은 열과 행에 대한 목록을 작성하는 것이 매우 간단하다는 것입니다.

>>> columns = [df.index.name] + [i for i in df.columns]
>>> rows = [[i for i in row] for row in df.itertuples()]

이는 다음과 같습니다.

>>> print(f"columns: {columns}\nrows: {rows}") 
columns: [None, 'first', 'second', 'third']
rows: [['alpha', 1, 2, 3], ['beta', 3, 4, 5]]

만약에None인덱스 이름이 번거로우므로 이름을 변경합니다.

df = df.rename_axis('stage')

그러면:

>>> columns = [df.index.name] + [i for i in df.columns]
>>> print(f"columns: {columns}\nrows: {rows}") 

columns: ['stage', 'first', 'second', 'third']
rows: [['alpha', 1, 2, 3], ['beta', 3, 4, 5]]

저는 인덱스를 보존하고 싶어서 원래의 답변을 이 솔루션에 적용했습니다.

list_df = df.reset_index().values.tolist()

이제 다른 곳에 붙여넣을 수 있습니다(예: 스택 오버플로 질문에 붙여넣을 수 있음). 나중에 다시 만들 수 있습니다.

pd.Dataframe(list_df, columns=['name1', ...])
pd.set_index(['name1'], inplace=True)

고객의 요구사항에 적합한지는 모르겠지만 다음과 같은 작업도 수행할 수 있습니다.

>>> lol = df.values
>>> lol
array([[1, 2, 3],
       [3, 4, 5]])

이것은 ndarray 모듈의 numpy 배열일 뿐입니다. 이를 통해 일반적인 numpy 배열 작업을 모두 수행할 수 있습니다.

저는 이런 문제가 있었습니다: xlsxwriter를 사용하여 df 헤더를 엑셀의 1행에 쓰기 위해 0행에 있게 하려면 어떻게 해야 합니까?제안된 해결책 중 어떤 것도 효과가 없었지만, 그들은 저를 올바른 방향으로 이끌었습니다.코드가 한 줄 더 필요했어요

# get csv data
df = pd.read_csv(filename)

# combine column headers and list of lists of values
lol = [df.columns.tolist()] + df.values.tolist()

뭔가 바뀌었을 수도 있지만, 이것은 제가 필요로 하는 것을 해주는 ndarray 목록을 돌려주었습니다.

list(df.values)

문제와 관련이 없지만 동일한 기대를 가진 다른 맛

데이터 프레임 열을 리스트 목록으로 변환하여 Plotly에서 create_distplot을 사용하여 차트를 표시하는 방법

    hist_data=[]
    hist_data.append(map_data['Population'].to_numpy().tolist())

"df.values"는 numpy 배열을 반환합니다.이렇게 하면 데이터 유형이 보존되지 않습니다.정수를 부동 소수점으로 변환할 수 있습니다.

df.iterrows()는 데이터 유형의 보존을 보장하지 않는 시리즈를 반환합니다.참조: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iterrows.html

아래 코드는 목록으로 변환되고 데이터 유형을 보존합니다.

rows = [list(row) for row in df.itertuples()]

▁a우경▁wish▁▁you▁to▁ifPandas DataFrame하고 헤더 . " (으)로 표시됨"을 선택합니다.

import pandas as pd
def dfToTable(df:pd.DataFrame) -> list:
    return [list(df.columns)] + df.values.tolist()

사용량(REPL):

>>> df = pd.DataFrame(
             [["r1c1","r1c2","r1c3"],["r2c1","r2c2","r3c3"]]
             , columns=["c1", "c2", "c3"])
>>> df
     c1    c2    c3
0  r1c1  r1c2  r1c3
1  r2c1  r2c2  r3c3
>>> dfToTable(df)
[['c1', 'c2', 'c3'], ['r1c1', 'r1c2', 'r1c3'], ['r2c1', 'r2c2', 'r3c3']]

지금까지 제시된 솔루션은 "바퀴를 혁신하는" 접근 방식으로 인해 어려움을 겪고 있습니다.@AMC 인용:

라이브러리를 처음 사용하는 경우 필요한 기능이 Pandas 개체에서 이미 제공되는지 다시 확인해 보십시오.

데이터 프레임을 목록 목록으로 변환하면 인덱스 및 열 이름과 같은 정보가 손실됩니다.

내 해결책: to_dict()를 사용합니다.

dict_of_lists = df.to_dict(orient='split')

세 목록이 사전이 됩니다.index,columns,data로 열과 이름이하지 않다고 한다면, 수 있습니다.

dict_of_lists['data']

DataFrame.iterrows() 함수를 사용하여 지정된 DataFrame의 각 행에 대해 반복하고 각 행의 데이터로 목록을 구성할 수 있습니다.

# Empty list 
row_list =[] 

# Iterate over each row 
for index, rows in df.iterrows(): 
    # Create list for the current row 
    my_list =[rows.Date, rows.Event, rows.Cost] 

    # append the list to the final list 
    row_list.append(my_list) 

# Print 
print(row_list)

주어진 데이터 프레임의 각 행을 목록으로 성공적으로 추출할 수 있습니다.

이것은 매우 간단합니다.

import numpy as np

list_of_lists = np.array(df)

참고: 스택 오버플로에서 Pandas Series 또는 DataFrame을 NumPy 어레이 또는 일반 Python 목록으로 변환할 필요가 전혀 없는 경우를 많이 보았습니다.라이브러리를 처음 사용하는 경우 필요한 기능이 Pandas 개체에서 이미 제공되는지 다시 확인해 보십시오.

@jpp의 의견을 인용하자면:

실제로 NumPy 배열을 목록으로 변환할 필요가 없는 경우가 많습니다.

Pandas DataFrame/Series가 작동하지 않는 경우 기본 제공 및 방법을 사용할 수 있습니다.

인덱스 열 또는 헤더 행을 포함할 수 있는 함수:

def df_to_list_of_lists(df, index=False, header=False):
    rows = []
    if header:
        rows.append(([df.index.name] if index else []) + [e for e in df.columns])
    for row in df.itertuples():
        rows.append([e for e in row] if index else [e for e in row][1:])
    return rows

언급URL : https://stackoverflow.com/questions/28006793/pandas-dataframe-to-list-of-lists

'programing' 카테고리의 다른 글

파일 또는 어셈블리 '시스템'을 로드할 수 없습니다.보안.주요한.윈도우' (0)	2023.06.09
TypeScript 컴파일러 오류에도 불구하고 내 React Native 앱이 성공적으로 빌드되는 이유는 무엇입니까? (0)	2023.06.09
VBA/Excel에서 Google Chrome 열기 (0)	2023.06.09
Python pep-8이 들여쓰기를 위해 탭 위에 공백을 두는 것을 강력히 권장하는 이유는 무엇입니까? (0)	2023.06.09
OpenXML 형식 SDK를 사용하여 스프레드시트에서 데이터를 읽는 방법은 무엇입니까? (0)	2023.06.09

현재글목록에 포함된 판다 데이터 프레임

각종 프로그래밍 정보를 다루는 블로그입니다.

Spring-boot, Java, json, Excel, reactjs, php, C, Git, angularJS, asp.net, python, wordpress, mysql, MariaDB, javascript, jQuery, vuejs2, vuex, MongoDB, Oracle,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

newsource

목록에 포함된 판다 데이터 프레임

목록에 포함된 판다 데이터 프레임

'programing' 카테고리의 다른 글

'programing'의 다른글

티스토리툴바

목록에 포함된 판다 데이터 프레임

목록에 포함된 판다 데이터 프레임

'programing' 카테고리의 다른 글

'programing'의 다른글

관련글

티스토리툴바