Расчёт на pyspark

Всем доброго времени суток!
Помогите, пожалуйста, написать код для расчета на pyspark
Нужно рассчитать, в какой категории лучше всего продаются дорогие товары, у которых цена до скидки была больше 1000 рублей включительно.
В расчет нужно брать только продажи в 2019 году. Нужно ввести 2 числа через запятую — номер категории и количество проданных дорогих товаров, например «6,96467».
Колонки в анализируемом файле называются:
Product_id — идентификатор товара;
Price — цена товара (с учетом скидки);
Datetime — дата и время покупки;
Category — идентификатор категории товара;
Discount — скидка, которая была применена.
30 апреля 2020 в 11:16
Ближайшие курсы

Как начать свой путь в разработке?
Онлайн-курс
28
февраля
Как стать iOS-разработчиком?
Онлайн-курс
28
февраля
Как стать веб-разработчиком?
Онлайн-курс
28
февраля
Новые статьи

Как защитить Windows: системный подход
34100

«После Scratch поняла, что не хочу бросать программирование»
77800

Что такое MVP и зачем его делать
56100