Мудрый Экономист

Использование программы eviews для расчета мультипликатора просроченной задолженности

"Банковский ритейл", 2014, N 1

В статье на основе статистики Банка России за последние 13 лет дается методика расчета мультипликатора просроченной задолженности по розничным кредитам, которую любой банк, используя данные по своему портфелю, может применить на практике. Для изучения потока неплатежей заемщиков - физических лиц предлагается использовать так называемые лаги Алмон. Определяются наиболее рискованные периоды с точки зрения просрочки выплат по кредитам, в том числе с учетом сезонного фактора.

Прошлый год оказался годом опережающего роста просроченной задолженности по розничным кредитам: с 1 января по 1 декабря 2013 г. общая задолженность физлиц выросла на 26,2%, в то время как объем "плохих" долгов вырос на 40,6%. В результате доля просроченной задолженности по розничным кредитам за первые 11 месяцев текущего года повысилась с 4,05 до 4,53%, ежемесячно увеличиваясь в среднем на 0,04 п. п. Причем по мере расширения охвата розничным кредитованием различных категорий жителей России потенциал для дальнейшего роста просрочки будет нарастать.

Так, по результатам всероссийского опроса, проведенного в прошлом году Национальным агентством финансовых исследований (НАФИ), почти каждый второй россиянин имел опыт кредитования в течение последних 12 месяцев. Причем почти каждый третий заемщик испытывал затруднения при внесении очередного платежа по кредиту. По данным НАФИ, спрос на заемные деньги постепенно смещается в российскую глубинку (в небольшие города до 100 тыс. человек), где платежеспособность населения гораздо ниже, чем в крупных городах, что создает объективные предпосылки для еще более быстрого роста просроченной задолженности <1>.

<1> http://nacfin.ru/novosti-i-analitika/press/press/single/10577.html.

В связи с этим перед банками стоят задачи по разработке более эффективных скоринговых моделей для оценки платежеспособности той или иной категории заемщиков и усилению контроля за своевременным поступлением платежей по уже выданным розничным кредитам. В последнем случае определенным подспорьем для банка может стать использование статистических методов для выявления наиболее рискованных с точки зрения возникновения просрочки периодов выплат по кредитам.

Поток неплатежей с точки зрения лагов Алмон

В данном случае для изучения потока неплатежей заемщиков - физических лиц предлагается использовать так называемые лаги Ширли Алмон, в 1965 г. предложившей статистическую модель с лаговыми переменными, коэффициенты которых в уравнении регрессии в зависимости от номера лага описываются полиномом k-степени, частным случаем которого является линейная модель <1>.

<1> Более подробно теорию этого вопроса можно прочитать в статистической литературе. См., напр.: Эконометрика: Учебник / Под ред. И.И. Елисеевой. М.: Проспект, 2009. С. 210 - 216.

В данной статье мы займемся проблемой прикладного использования лагов Алмон с помощью программы EViews. С этой целью возьмем ежемесячные данные Банка России по кредитной задолженности физлиц (в млн руб.) за период с 1 января 2001 г. по 1 декабря 2013 г., обозначив их как независимую переменную - TOTAL_LOAN. В качестве зависимой переменной TOTAL_DEBT возьмем просроченную задолженность по этим кредитам (в млн руб.) за тот же период. Соответственно, любой банк при изучении временной структуры неплатежей может взять статистику по своему кредитному портфелю.

Прежде чем решать уравнение регрессии, необходимо выдвинуть предположение о вероятной структуре лага потока неплатежей. Иначе говоря, исследователь должен: во-первых, выдвинуть гипотезу по поводу максимально возможной величины лага возникновения просроченной задолженности; во-вторых, ответить на вопрос, описываются ли лаговые коэффициенты решаемого уравнения регрессии в зависимости от номера их лага линейной моделью либо полиномом второй или третьей степени. При этом заметим, что полиномы с более высокой степенью на практике используются редко, а величина максимального лага не должна быть меньше степени полинома, описывающего структуру лаговых коэффициентов регрессии.

Полагаем, что потоки неплатежей по банковскому сектору РФ целесообразно анализировать, взяв в качестве первоначального максимального лага пятилетний период, или 60 месяцев, прошедших после выдачи соответствующего кредита. Вполне естественно, что в зависимости от имеющейся у него информации банк может взять несколько иной первоначальный максимальный лаг, но при этом надо иметь в виду, что чем больше будет этот лаг, тем более длинный временной статистический ряд потребуется для проведения полноценного исследования. В частности, при максимальном лаге 60 месяцев, на наш взгляд, желательно иметь статистику по кредитному портфелю по крайней мере за последние 10 - 12 лет.

Далее нам нужно определиться со структурой зависимости лаговых коэффициентов уравнения регрессии от номера их лага. С этой целью решаются уравнения регрессии как для линейной модели, так и для полиномов второй и третьей степени. Поиск адекватного решения проводится методом проб и ошибок, а поэтому носит довольно трудоемкий характер, несмотря на использование современных компьютерных вычислительных программ.

Проверка статистической модели на адекватность

После каждого решенного уравнения регрессии EViews выдает результаты, которые необходимо тщательно анализировать, обращая внимание на следующие параметры. Во-первых, надо учитывать величину коэффициента детерминации (в EViews обозначается как R-squared), который должен быть равен 0,8 - 0,9, а еще лучше, если он будет выше. Во-вторых, обращать внимание на статистическую значимость коэффициентов уравнения регрессии, p-значения (Prob.) которых при выбранном нами 95%-ном уровне надежности должны быть ниже 0,05. В-третьих, смотреть на величину относительной ошибки прогноза по модулю (Mean Absolute Percentage Error), рассчитанного с помощью данного уравнения регрессии.

В данном случае после перебора различных статистических моделей в качестве основной гипотезы мы выдвинули предположение, что поток неплатежей по банковскому сектору РФ лучше описывается полиномом второй степени и имеет максимальную величину лага, равную 22 месяцам. Сам процесс решения уравнения регрессии в EViews осуществляется при помощи ввода следующей понятной для программы формулы:

TOTAL_DEBT C pdl (TOTAL_LOAN, 22, 2), (1)

где C - константа;

pdl - полиноминально распределенные лаги Алмон;

22 - максимальная величина используемого в уравнении лага;

2 - полином второй степени, описывающий распределение лаговых коэффициентов регрессии в зависимости от величины их лага.

Вводим формулу (1) в мини-окно Equation Estimation ("Решение уравнения") и нажимаем OK (рис. 1).

Мини-окно "Решение уравнения" Рисунок 1

В результате получаем табл. 1. Судя по данной таблице, коэффициент детерминации (R-squared) в решенном нами уравнении регрессии оказался равен 0,992916. Соответственно, включенные в уравнение регрессии независимые переменные (факторы) в 99,3% случаев объясняют изменения зависимой (результативной) переменной TOTAL_LOAN, что является очень высоким показателем.

Таблица 1

Результаты решения уравнения регрессии в EViews

Dependent Variable: TOTAL_DEBT

Method: Least Squares

Date: 09/23/13 Time: 17:21

Sample (adjusted): 2002M11 2013M09

Included observations: 130 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-6200,166

1574,699

-3,937367

0,0001

PDL01

-0,004468

0,000565

-7,909954

0,0000

PDL02

0,000643

2,47E-05

26,02449

0,0000

PDL03

0,000176

1,28E-05

13,69460

0,0000

R-squared

0,992916

Mean dependent var

145818,9

Adjusted R-squared

0,992748

S.D. dependent var

129115,2

S.E. of regression

10995,64

Akaike info criterion

21,47867

Sum squared resid

1,52E+10

Schwarz criterion

21,56690

Log likelihood

-1392,114

Hannan-Quinn criter

21,51452

F-statistic

5887,008

Durbin-Watson stat

0,152404

Prob (F-statistic)

0,000000

Lag Distribution of TOTAL_LOAN

i

Coefficient

Std. Error

t-Statistic

   .  *    ¦

0

0,00973

0,00097

10,0585

   . *     ¦

1

0,00668

0,00071

9,45303

   .*      ¦

2

0,00398

0,00048

8,37908

   .*      ¦

3

0,00164

0,00028

5,84595

   *       ¦

4

-0,00036

0,00016

-2,29739

  *.       ¦

5

-0,00200

0,00018

-10,8772

 * .       ¦

6

-0,00329

0,00029

-11,4386

 * .       ¦

7

-0,00423

0,00039

-10,9235

*  .       ¦

8

-0,00482

0,00047

-10,3106

*  .       ¦

9

-0,00505

0,00052

-9,64054

*  .       ¦

10

-0,00494

0,00056

-8,86568

 * .       ¦

11

-0,00447

0,00056

-7,90995

 * .       ¦

12

-0,00365

0,00055

-6,65325

  *.       ¦

13

-0,00248

0,00051

-4,88094

  *.       ¦

14

-0,00096

0,00044

-2,15598

   *       ¦

15

0,00092

0,00036

2,55309

   .*      ¦

16

0,00314

0,00026

12,0594

   . *     ¦

17

0,00572

0,00018

31,6244

   .  *    ¦

18

0,00865

0,00021

40,3810

   .   *   ¦

19

0,01193

0,00037

32,6062

   .    *  ¦

20

0,01556

0,00057

27,2095

   .     * ¦

21

0,01954

0,00081

24,0595

   .      *¦

22

0,02387

0,00108

22,0702

Sum of Lags

0,07512

0,00066

113,627

Источник: расчеты автора по данным Банка России.

Далее результаты решения уравнения регрессии нужно проверить на статистическую значимость коэффициентов уравнения регрессии. Об уровне значимости константы C и коэффициентов регрессии преобразованных переменных PDL01, PDL02 и PDL03 <1> (верхняя часть табл. 1) можно судить по близкой к нулю величине их p-значений, которая при выбранном нами 95%-ном уровне надежности не должна быть выше 0,05. В верхней части табл. 1 в виде столбца под надписью Prob даны p-значения для каждого коэффициента регрессии.

<1> Подробно об алгоритме их трансформации см.: Эконометрика: Учебник / Под ред. И.И. Елисеевой. М.: Проспект, 2009. С. 210 - 212.

Правда, в нижней части табл. 1 p-значения для лагов независимой переменной TOTAL_LOAN не приводятся, но их можно вычислить с помощью представленной здесь t-статистики (см. цифры, расположенные ниже надписи t-Statistic). Например, у коэффициента регрессии 14-го лага величина t-критерия равна -2,22877; имея эту информацию, нетрудно найти его p-значение с помощью Excel, воспользовавшись следующей формулой:

= СТЬЮДРАСП (ABS (-2,22877); 129; 2) = 0,0276, (2)

где ABS (-2,22877) - величина t-критерия по модулю;

129 - число степеней свободы (число наблюдений во временном ряде - число независимых переменных в уравнении - 1); -1 = 133 - 3 - 1 = 129;

0,0276 - величина полученного p-значения.

Таким образом, поскольку величина p-значения у коэффициента регрессии 14-го лага оказалась меньше 0,05, вполне можно сделать вывод о том, что он является статистически значимым. Далее с помощью формулы (2) мы нашли p-значения для коэффициентов регрессии всех лагов независимой переменной TOTAL_LOAN, а также для коэффициента регрессии, характеризующего суммарное воздействие всех лагов (Sum of Lags). В результате нам удалось выяснить, что все они статистически значимы с 95%-ным уровнем надежности, поскольку их p-значения не превышают 0,05 (табл. 2).

Таблица 2

Величина p-значения для коэффициентов всех лагов независимой переменной TOTAL_LOAN

Величина лага независимой переменной TOTAL_LOAN

t-статистика

p-значения

0

10,0585

0,0000

1

9,45303

0,0000

2

8,37908

0,0000

3

5,84595

0,0000

4

-2,29739

0,0232

5

-10,8772

0,0000

6

-11,4386

0,0000

7

-10,9235

0,0000

8

-10,3106

0,0000

9

-9,64054

0,0000

10

-8,86568

0,0000

11

-7,90995

0,0000

12

-6,65325

0,0000

13

-4,88094

0,0000

14

-2,15598

0,0330

15

2,55309

0,0119

16

12,0594

0,0000

17

31,6244

0,0000

18

40,381

0,0000

19

32,6062

0,0000

20

27,2095

0,0000

21

24,0595

0,0000

22

22,0702

0,0000

Sum of Lags

113,627

0,0000

Источник: расчеты автора.

Выбрав в EViews опцию Forecast of Estimation ("Прогноз по уравнению"), получим табл. 3, в которой можно посмотреть величину относительной ошибки прогноза по модулю (Mean Absolute Percentage Error), равную 13,68048. Таким образом, при прогнозировании по рассматриваемому нами уравнению регрессии относительная ошибка прогноза по модулю составила 13,7%.

Таблица 3

Относительная ошибка прогноза и другие параметры полученного уравнения регрессии

Forecast: TOTAL_DEBTF

Actual: TOTAL_DEBT

Forecast sample: 2001M01 2014M01

Adjusted sample: 2002M11 2013M09

Included observations: 130

Root Mean Squared Error

10825,16

Mean Absolute Error

7658,709

Mean Absolute Percentage Error

14,30639

Theil Inequality Coefficient

0,027859

Bias Proportion

0,000000

Variance Proportion

0,001777

Covariance Proportion

0,998223

Источник: расчеты автора.

Заметим, что для прогностических моделей желательно, чтобы этот показатель находился на уровне 7 - 10%, но в нашей статистической модели, используемой для ретроспективного анализа (оценки лаговой специфики потока неплатежей по розничным кредитам), полученная величина относительной ошибки прогноза вполне приемлема.

Подробное объяснение значений других параметров, представленных в табл. 3, увело бы нас слишком далеко от нашей темы. Скажем только, что такие показатели, как коэффициент неравенства Тейла (Theil Inequality Coefficient), доля систематической ошибки (Bias Proportion) и доля вариации (Variance Proportion), в адекватном уравнении регрессии должны стремиться к нулю, в то время как доля ковариации (Covariance Proportion) должна стремиться к единице. В табл. 3 легко увидеть, что все перечисленные выше параметры имеют необходимые оптимальные значения.

Наиболее рискованные периоды выплат по кредитам

Убедившись в статистической значимости полученного уравнения регрессии, перейдем к его содержательной интерпретации. В частности, коэффициент регрессии, равный при нулевом лаге 0,00973 (см. табл. 1), свидетельствует о том, что рост на 1 млн руб. выданных розничных кредитов уже в месяц их выдачи способствовал увеличению просрочки по банковскому сектору РФ в среднем на 9,73 тыс. руб.

Соответственно, коэффициент регрессии, равный при лаге в один месяц 0,00669, говорит о том, что рост на 1 млн руб. объема выданных физлицам кредитов через месяц после их выдачи способствовал увеличению просрочки в среднем на 6,69 тыс. руб.

В целом рост объема выданных розничных кредитов на 1 млн руб. в течение 22 месяцев заимствования приводил к суммарному увеличению просрочки (см. коэффициент регрессии Sum of Lags = 0,07508) в среднем на 75,08 тыс. руб.

Поскольку в данном случае мы имеем дело с 24 лаговыми коэффициентами регрессии независимой переменной TOTAL_LOAN (включая нулевой лаг и суммарное воздействие лагов), их интерпретацию целесообразно дать в виде табл. 4. Представленные здесь лаговые коэффициенты регрессии независимой переменной TOTAL_LOAN являются своего рода мультипликатором просрочки по розничным кредитам в зависимости от роста их выданного объема.

Таблица 4

Мультипликатор просроченной задолженности по розничным кредитам в зависимости от роста их выданного объема

Величина лага независимой переменной TOTAL_LOAN

Коэффициент регрессии лага

Средний рост просроченной задолженности на 1 млн руб. выданных физлицам кредитов, тыс. руб.

Относительный вклад лага в рост просроченной задолженности по кредитам физлиц, %

0

0,00973

9,73

13,0

1

0,00668

6,68

8,9

2

0,00398

3,98

5,3

3

0,00164

1,64

2,2

4

-0,0004

-0,36

-0,5

5

-0,002

-2,00

-2,7

6

-0,0033

-3,29

-4,4

7

-0,0042

-4,23

-5,6

8

-0,0048

-4,82

-6,4

9

-0,0051

-5,05

-6,7

10

-0,0049

-4,94

-6,6

11

-0,0045

-4,47

-6,0

12

-0,0037

-3,65

-4,9

13

-0,0025

-2,48

-3,3

14

-0,001

-0,96

-1,3

15

0,00092

0,92

1,2

16

0,00314

3,14

4,2

17

0,00572

5,72

7,6

18

0,00865

8,65

11,5

19

0,01193

11,93

15,9

20

0,01556

15,56

20,7

21

0,01954

19,54

26,0

22

0,02387

23,87

31,8

Sum of Lags

0,07512

75,12

100,0

Источник: расчеты автора.

В табл. 4 мы также даем оценку относительного вклада (в процентах) каждого лага в рост просрочки по розничным кредитам. С этой целью необходимо поделить коэффициент регрессии каждого лага (в млн руб.) на коэффициент регрессии суммарного увеличения просрочки по кредитам физлиц за 22 месяца (Sum of Lags = 0,07508 млн руб.), а полученное частное умножить на 100%.

Например, для нулевого лага его относительный вклад в рост просрочки по розничным кредитам вычисляется следующим образом: 0,00973 млн руб. / 0,07508 млн руб. x 100% = 13,0%.

Таким образом, 13% всей просроченной задолженности в банковском секторе РФ возникает уже в месяце выдачи розничного кредита! Это говорит как о недостаточно эффективной оценке банками платежеспособности заемщиков, так и о различных мошеннических схемах, используемых недобросовестными гражданами для получения заемных денежных средств. Заметим, что в данном случае речь идет не о формальной просроченной задолженности по кредитам, к которой относят непогашенные долги сроком более 90 дней, а о фактически возникающей задолженности, "улавливаемой" нашей статистической моделью.

Судя по табл. 4, с 1-го по 3-й месяцы после выдачи кредита относительный вклад лаговых коэффициентов регрессии в рост просрочки по долгам постепенно снижается с 8,9 до 2,2%, в то время как с 4-го по 14-й месяцы после выдачи кредита он становится отрицательным. Иначе говоря, суммарный поток погашающих просрочку платежей в этот период заимствования в среднем оказывается больше растущей просрочки по кредитам физлиц. Причем своего максимума погашение просроченной задолженности достигает на 9-м месяце заимствования, вклад которого в ее сокращение равен -6,8%, а потом этот показатель начинает постепенно снижаться до тех пор, пока с 15-го месяца заимствования относительный вклад лаговых коэффициентов регрессии в рост просрочки не становится вновь положительным и, постепенно нарастая, на 22-м месяце заимствования достигает своего максимума, равного 31,9%.

В целом полученный нами мультипликатор роста просроченной задолженности в зависимости от роста объема кредитов, выданных физлицам, можно представить в виде параболы (рис. 2). Причем с помощью формулы легко найти коэффициент любого лага:

где y - величина коэффициента регрессии лага;

x - номер лага.

Мультипликатор роста просрочки по кредитам физлиц в РФ Рисунок 2

Например, для второго лага величина коэффициента его регрессии находится следующим образом:

Вклад сезонного фактора в рост просроченной задолженности

Программа EViews позволяет также выделить в динамике роста просроченной задолженности и выданных розничных кредитов имеющую циклический характер сезонную компоненту. С этой целью можно воспользоваться опциями Seasonal Adjustment/Moving Average Methods/Ratio to Moving Average (корректировка данных с учетом сезонности по мультипликативной модели). В результате EViews выдала нам мультипликативные (индексные) оценки сезонности по каждому месяцу, которые легко можно перевести в проценты (табл. 5).

Таблица 5

Мультипликативные оценки сезонных колебаний в росте просроченной задолженности и объема выданных кредитов

Месяц

Индексы сезонных колебаний в росте просроченной задолженности по розничным кредитам

Сезонные колебания в росте просроченной задолженности по розничным кредитам, %

Индексы сезонных колебаний в росте выданных розничных кредитов

Сезонные колебания в росте выданных розничных кредитов, %

Январь

0,979

-2,1

0,982

-1,8

Февраль

0,995

-0,5

0,969

-3,1

Март

0,988

-1,2

0,970

-3,0

Апрель

0,997

-0,3

0,985

-1,5

Май

1,004

0,4

0,988

-1,2

Июнь

1,009

0,9

1,001

0,1

Июль

1,019

1,9

1,009

0,9

Август

1,019

1,9

1,019

1,9

Сентябрь

1,017

1,7

1,022

2,2

Октябрь

1,013

1,3

1,021

2,1

Ноябрь

1,008

0,8

1,023

2,3

Декабрь

0,956

-4,4

1,013

1,3

Источник: расчеты автора.

Судя по табл. 5, за счет сезонных колебаний рост просрочки в декабре, когда банки обычно "подчищают" свой баланс, готовясь к годовой отчетности, в среднем снижается на 4,4% по сравнению со среднемесячным уровнем. Причем эта тенденция в более ослабленном виде сохраняется вплоть до апреля, а затем просрочка по розничным кредитам растет, достигая своего сезонного максимума в июле и августе - 1,8 - 1,9%. Очевидно, что в эти месяцы заемщики тратят много средств на летний отдых, поэтому у них и возникают сложности с уплатой текущих платежей по кредитам. В сентябре рост просрочки за счет сезонного фактора несколько ниже, чем в июле - августе, а в октябре и ноябре он еще больше снижается, пока вновь не достигнет своего минимума в декабре.

Говоря о сезонных колебаниях в росте просрочки по выданным розничным кредитам, следует заметить, что во второй половине года он выше среднемесячного по текущему году уровня, а в первой половине года - ниже. Причем, за исключением декабря и мая, во всех остальных месяцах сезонный рост или снижение объема кредитования сопровождается аналогичной динамикой просроченной задолженности. Таким образом, сезонный фактор в целом также оказывает влияние на мультипликатор роста просроченной задолженности.

Выводы

Смещение спроса на заемные деньги в российскую глубинку, где платежеспособность населения гораздо ниже, создает объективные предпосылки для более быстрого роста просроченной задолженности. Поэтому перед банками стоит задача использования статистических методов для выявления наиболее рискованных с точки зрения возникновения просрочки периодов выплат по кредитам.

Исследование потока неплатежей по банковскому сектору РФ с помощью лагов Алмон привело к созданию адекватной статистической модели, описывающей данный процесс. Оценка относительного вклада лаговых коэффициентов регрессии в рост просрочки показала, что в банковском секторе РФ наиболее рискованными являются нулевой и 19 - 22-й месяцы заимствования. За счет сезонных колебаний рост просрочки достигает своего максимума в июле - августе, когда заемщики тратят много средств на летний отдых, в то время как наибольшее сокращение просрочки имеет место в декабре, когда банки готовятся к годовой отчетности.

На наш взгляд, предложенная методика может быть использована любым банком для анализа собственного кредитного портфеля.

В.Г.Брюков

Банковский аналитик