Rename Column Name case in Dataframe

Requirement: To change column names to upper case or lower case in PySpark

Create a dummy dataframe

#create a dataframe with sample values
columns = ["Emp_id","Emp_name","Emp_dept"]
data = [("1", "Falcon","Admin"), ("2", "Winter Soldier","HR"), ("3","Wanda", "Technology"),("4","Vision","Data Analytics")]
rdd = spark.sparkContext.parallelize(data)
df_employee = rdd.toDF(columns)
df_employee.printSchema()

root
 |-- Emp_id: string (nullable = true)
 |-- Emp_name: string (nullable = true)
 |-- Emp_dept: string (nullable = true)

Convert column names to uppercase in PySpark

You can use “withColumnRenamed” function in FOR loop to change all the columns in PySpark dataframe to uppercase by using “upper” function.

#convert all column name to uppercase
for col in df_employee.columns:
    df_employee = df_employee.withColumnRenamed(col, col.upper())

#print column names
df_employee.printSchema()

root
 |-- EMP_ID: string (nullable = true)
 |-- EMP_NAME: string (nullable = true)
 |-- EMP_DEPT: string (nullable = true)

Convert column names to lowercase in PySpark

You can use “withColumnRenamed” function in FOR loop to change all the columns in PySpark dataframe to lowercase by using “lower” function.

#convert all column name to lowercase
for col in df_employee.columns:
    df_employee = df_employee.withColumnRenamed(col, col.lower())

#print column names
df_employee.printSchema()

root
 |-- emp_id: string (nullable = true)
 |-- emp_name: string (nullable = true)
 |-- emp_dept: string (nullable = true)

You can also use “swapcase” or “capitalize” function in place of upper or lower as per requirement.

Ramkumar on Spark Performance Tuning with help of Spark UIFebruary 3, 2025
Great. Keep writing more articles.
Raj on Free Online SQL to PySpark ConverterAugust 9, 2022
Thank you for sharing this. I will give it a try as well.
John K-W on Free Online SQL to PySpark ConverterAugust 8, 2022
Might be interesting to add a PySpark dialect to SQLglot https://github.com/tobymao/sqlglot https://github.com/tobymao/sqlglot/tree/main/sqlglot/dialects
Meena M on Spark Dataframe WHEN caseJuly 28, 2022
try something like df.withColumn("type", when(col("flag1"), lit("type_1")).when(!col("flag1") && (col("flag2") || col("flag3") || col("flag4") || col("flag5")), lit("type2")).otherwise(lit("other")))
tagu on Free Online SQL to PySpark ConverterJuly 20, 2022
It will be great if you can have a link to the convertor. It helps the community for anyone starting…

Requirement: To change column names to upper case or lower case in PySpark

Create a dummy dataframe

Convert column names to uppercase in PySpark

Convert column names to lowercase in PySpark

Leave a ReplyCancel reply