Quint

Updates & Questions#

Doordat het verzamelen van data en uitvoeren van analyses wat tegenviel en omdat ik een week ziek ben geweest met corona ben ik niet zover als ik had willen zijn. In de bijlage heb ik de descriptive statistics bijgevoegd. De dataverzameling is nu gelukkig compleet. Er zijn op dit moment geen redenen waarom ik vastloop. Het enige probleem is dat ik te weinig tijd heb gehad. Op dit moment ben ik daarom van plan om mijn hypothese enkel te testen met de analyst forecast error en de CAR analyse pas toe te voegen als ik genoeg tijd hiervoor heb.

Prima, dat kan gebeuren, en er is nog tijd voor. De analyst forecast error is goed uitgelegd, dus probeer dat ook te doen met de CAR analyse als je dat nog gaat doen.

Er zijn echter wel wat concrete vragen die ik heb: welke facetten zijn nog mooi om te verwerken in de resultatensectie? Op dit moment wil ik descriptive statistics, een tabel met observaties per jaar van de finale dataset en een correlatietabel van de finale dataset toevoegen.

Is het bijvoorbeeld nuttig om met een t-test te bepalen of bepaalde variabelen tussen de target groep en de controlegroep verschillen?

Ja, zeker!

Verder ben ik iets vrijer geweest met het minimum aantal analyst forecasts (4 in het afgelopen half jaar) om genoeg observaties te krijgen. Gaat dit te ver, of kan dit nog?

Dat kan nog, en dit kun je inderdaad varieren!

Aantal opmerkingen#

  • Section 2.4 is actually an argument for a direct effect of analysts coverage on information provision, or at least, of a direct relationship between them, not necessarily of an moderator of the option listing-information availability relationship.

This study argues that it does not matter that the first earnings announcement might be several months after the option listing since the effects of option listing are hypothesized to be lasting.

Could this be tested in some way?

  • It may be better to just denote the control variables with the vector $X$ rather than a very long equation.

  • It might be good to mention the expected sign on the coefficients according to the hypotheses.

  • matchit is a good package for the matched analysis, although I am still waiting for the output from that analysis.

  • What do the tables on p. 27 show?

  • The matched estimator is technically not a regression algorithm.

  • You should compare the results you get from a normal regression to the matched estimator to get an impression of the selection bias (and then argue that the matched estimator is better).

  • Try to play with the parameters inside the Matched analysis as well.

Finally#

  • Your R code is much more difficult than it could (should) be. Check out the tidyverse packages, and their documentation, and make use of the fact that you can write a lot of dataframes to the memory, and analyse the ones you need at that moment.

  • For example, filtering:

library(tidyverse)

df %>%
    filter(var1 == "Deze waarde") %>%
    summarize(mean_randd = mean(rand_spending, na.rm = TRUE),
                mean_optionlisting = mean(opt_listing, na.rm = TRUE)
                )

  • It is also easy to use stargazer to generate descr. statistics:
library(stargazer)

stargazer(dataset, type = "html", out = "descriptives.docx")

model1 <- lm(data = dataset, formula = y ~ z)
model2 <- #..etc. 

stargazer(model1, model2, etc, type = "html", out = "regressiontable.docx")

  • Correlation tables can be generated in a similar (easy) way, check google.