Anàlisi i interpretació de taules i gràfics estadístics de distribucions estadístiques unidimensionals o bidimensionals amb variables qualitatives, quantitatives discretes i quantitatives contínues.
[ESS]
#ALG.VA
Recollida i organització en taules de contingència de dades bidimensionals.
#EST.IN
Representació de distribucions bidimensionals mitjançant núvols de punts. Recta de regressió; concepte i interpretació. Coeficient de correlació lineal: concepte i utilitat com a eina d'anàlisi.
Identificació, representació i ajust de funcions de regressió no lineals (polinòmica, exponencial, logarítmica…).
[AMP]
Ús de mitjans adequats per al tractament i estudi de distribucions bidimensionals.
#ALG.PC
Càlcul i interpretació de paràmetres estadístics de centralització i dispersió.
Comparació de distribucions de dades atenent mesures de posició i dispersió.
Descripció i orientacions
Reflexions generals
Els estudiants poden enfrontar-se a diverses dificultats en el tractament i la representació de dades bidimensionals a causa de la complexitat que comporta analitzar la relació entre dues variables. Una de les principals dificultats és reconèixer si les variables tenen algun tipus de relació i determinar-ne la naturalesa, ja sigui positiva, negativa o inexistent. A més, l’alumnat pot tenir dificultats a diferenciar el paper de cada variable, concretament distingir entre la variable explicativa i la variable explicada, sobretot en l’àmbit de la regressió.
La interpretació dels gràfics de dispersió és un altre aspecte que sovint presenta reptes. L’alumnat sol presentar problemes per identificar tendències generals o patrons entre els punts del gràfic, com relacions lineals o no lineals. Aquesta situació es complica encara més quan es treballa amb el coeficient de correlació, ja que entendre el significat del seu valor numèric, la magnitud, el signe i les seves limitacions no sempre és intuïtiu. També és comú que es passi per alt l’efecte de terceres variables que poden influir en la relació observada, fet que dificulta l’anàlisi de les dades i que podria portar a conclusions poc precises.
Un error recurrent que hem de treballar a classe és la confusió de correlació amb causalitat, ja que s’assumeix incorrectament que una associació entre dues variables implica una relació de causa-efecte. Cal tenir en compte que les dades no reflecteixen causes i efectes de manera directa: som nosaltres els que atorguem significats a aquestes associacions. Així mateix, la transició entre diferents formats de representació —com ara gràfics, taules, descripcions verbals o càlculs numèrics— també genera dificultats, ja que no sempre es comprèn com s’interrelacionen aquestes formes de representar les dades. Finalment, interpretar la recta de regressió, incloent-hi el significat del pendent i la intersecció en el context del problema, representa un altre desafiament important.
Superar aquestes dificultats requereix una pràctica contínua, l’ús d’exemples contextualitzats i una atenció especial a la diversitat de formats de representació presentats a classe, resultarà fonamental per a una comprensió més profunda i aplicada de les dades bidimensionals.
Comentaris sobre les connexions
El saber#4.EST.DI.A, referent a l’anàlisi i interpretació de taules i gràfics estadístics de distribucions estadístiques connecta amb el saber #4.ALG.VA.C, variables en distribucions estadístiques bidimensionals.
Per altra banda, el saber #4.EST.DI.E està connectat amb el saber #4.EST.PI.C, càlcul de probabilitats en esdeveniments dependents i independents, compatibles i incompatibles.
Observacions sobre alguns sabers d’aquest bloc
A 4t d’ESO considerem com a saber essencial el saber #4.EST.DI.A, l’anàlisi i interpretació de taules i gràfics estadístics és fonamental a 4t d’ESO perquè dota l’alumnat d’eines per afrontar situacions reals en un món altament influït per la informació i les dades.
Comprendre i interpretar distribucions estadístiques unidimensionals i bidimensionals, amb variables qualitatives, quantitatives discretes i contínues, permet als estudiants analitzar dades de forma rigorosa i detectar patrons o tendències que són rellevants en diversos contextos. Aquesta capacitat és imprescindible en àmbits acadèmics, laborals i quotidians, com l’economia, la salut, l’entorn social i el medi ambient, on la presa de decisions sovint depèn de la interpretació adequada d’informació estadística.
A més, l’anàlisi de taules i gràfics estadístics ajuda a desenvolupar habilitats transversals, com la capacitat de relacionar informació, identificar relacions entre variables, i plantejar hipòtesis raonades. En el cas de les variables bidimensionals, els estudiants aprenen a entendre relacions més complexes i a evitar errors comuns, com confondre correlació amb causalitat.
Comentaris sobre els sabers essencials i d’ampliació
L’estudi i comprensió de les funcions de regressió no lineals, com les polinòmiques, exponencials i logarítmiques, saber #4.EST.DI.D, constitueixen un saber d’ampliació a 4t d’ESO perquè impliquen un nivell d’abstracció i una complexitat conceptual superior al que s’aborda en els continguts bàsics de l’educació secundària obligatòria. Aquest tipus de regressions van més enllà de les necessitats essencials del currículum general, però resulta clau per preparar els alumnes que desitgen aprofundir en l’àmbit científic, tècnic o econòmic en estudis posteriors.
Igualment, treballar amb aquest tipus de funcions requereix una comprensió més profunda de conceptes matemàtics i estadístics, així com habilitats per utilitzar eines gràfiques i tecnològiques, com programes de càlcul o gràfics digitals.
Anàlisi i interpretació de taules i gràfics estadístics de distribucions estadístiques unidimensionals o bidimensionals amb variables qualitatives, quantitatives discretes i quantitatives contínues.
Recollida i organització en taules de contingència de dades bidimensionals.
Representació de distribucions bidimensionals mitjançant núvols de punts. Recta de regressió; concepte i interpretació. Coeficient de correlació lineal: concepte i utilitat com a eina d'anàlisi.
Identificació, representació i ajust de funcions de regressió no lineals (polinòmica, exponencial, logarítmica…).
Ús de mitjans adequats per al tractament i estudi de distribucions bidimensionals.
Càlcul i interpretació de paràmetres estadístics de centralització i dispersió.
Comparació de distribucions de dades atenent mesures de posició i dispersió.
Recursos i activitats
Recursos i activitats per treballar sabers concrets
A continuació, es presenten algunes idees sobre recursos i activitats d’aprenentatge que poden contribuir a l’adquisició dels sabers d’aquest bloc.
A. Anàlisi i interpretació de taules i gràfics estadístics de distribucions estadístiques unidimensionals o bidimensionals amb variables qualitatives, quantitatives discretes i quantitatives contínues. [ESS] #ALG.VA
A 4t d’ESO continuarem treballant l’anàlisi i interpretació de dades, una habilitat essencial per entendre la realitat social i econòmica que ens envolta. El saber #4.EST.DI.A permet al nostre alumnat desenvolupar una millor comprensió del món, ser més crítics i informats, i preparar-se per a una societat cada cop més digitalitzada i orientada a les dades.
NRICH Perception versus reality
A mesura que els estudiants arriben a 4t d’ESO, tenen una millor capacitat per comprendre temes socials i econòmics més complexos. La interpretació de gràfics els ajuda a enfrontar-se a conceptes com la inflació, el PIB, l’índex de desocupació, o les polítiques fiscals i socials, que són fonamentals per comprendre el món que els envolta. Per exemple, un gràfic que mostri l’evolució de l’atur pot ajudar-los a entendre l’impacte de les polítiques econòmiques, o un gràfic de distribució de la riquesa pot revelar les desigualtats socials. Un dels vídeos que pot resultar interessants passar a classe per debatre la percepció de la gent sobre la riquesa i com hi hauria una distribució de la riquesa justa i comparar-la amb la situació real, la podem trobar a l’activitat de l’NRICH Perception versus reality, on a partir del vídeo de la Wealth inequality in the UK, s’anima posteriorment l’alumnat a plantejar-se noves preguntes i investigacions per contrastar les idees preconcebudes respecte a la realitat.
Gapminder
En la mateixa línia que Perception versus reality, el web de Gapminder posa a prova la nostra intuïció, sovint errònia, sobre els països en vies de desenvolupament. A més, ens ajuda a identificar conceptes equivocats sobre el món i pot ser una eina valuosa per treballar l’anàlisi de dades en contextos reals i socials.
Ministeri d’Economia Escenarios climáticos del cambio climático
L’anàlisi de gràfics és, sens dubte, essencial per estudiar temes de gran rellevància com el canvi climàtic. Els gràfics permeten representar de manera clara les tendències i els canvis que es produeixen al llarg del temps, cosa que és fonamental per entendre els efectes del canvi climàtic; també ajuden a entendre les connexions entre les activitats humanes i els canvis en el clima. Els gràfics permeten mostrar les concentracions de gasos d’efecte hivernacle com el CO₂ i les seves correlacions amb l’augment de les temperatures globals i poden ajudar els estudiants a veure com les emissions de CO₂ contribueixen al canvi climàtic. En el context del canvi climàtic, els gràfics no només mostren el passat i el present, sinó també les projeccions futures. Podeu trobar una gran quantitat de gràfics per comentar a l’aula al web del Ministeri d’Economia Escenarios climáticos del cambio climático: incertidumbre y certezas.
Un llibre de referència per treballar dades actuals que pot servir com a recurs més enllà dels proposats a cursos anteriors de l’ESO és Los números no mienten, de Vaclav Smil, que tracta qüestions d’enorme rellevància i proporciona als estudiants eines per comprendre les dades i les realitats globals d’una manera crítica i informada. El llibre es divideix en diversos blocs, per exemple, en canvis socials i econòmics globals en què, a través de dades i gràfics, es responen preguntes com: Què ocorre quan tenim menys nens? Està l’esperança de vida arribant al seu màxim? Què fa feliç a la gent?, o Per què el pollastre s’imposa com a font de proteïna a tot el món?; o el blocd’energia i medi ambient en què s’aporten evidències que responen a preguntes com: Què és pitjor per al medi ambient: el nostre automòbil o el nostre telèfon? Quin mitjà de transport té més eficiència energètica: l’avió, el tren o l’automòbil? Tonyina vermella: a punt de l’extinció?
Sens dubte, un llibre per reflexionar sobre com aquestes qüestions influeixen en les decisions econòmiques, polítiques i personals que es prenen al món.
B. Recollida i organització en taules de contingència de dades bidimensionals. #EST.IN
Llançaments a cistella
Per treballar la recollida de dades i la seva organització, saber#4.EST.DI.B, una possible activitat és recollir i analitzar la precisió dels llançaments a cistella a diferents distàncies dels membres de la classe, utilitzant una taula bidimensional per registrar els resultats. Aquesta activitat permet als estudiants practicar la recollida i la interpretació de dades i comprendre com es poden relacionar les variables de distància i encert en un experiment.
També poden observar les diferències en la precisió dels llançaments entre els diferents alumnes a cada distància i identificar possibles patrons si hi ha una relació entre augmentar la distància i disminuir la precisió o fer-nos preguntes sobre els factors que poden influir en la diferència de resultats entre l’alumnat, per exemple, la tècnica, l’experiència prèvia, l’actitud, la concentració o l’altura.
S’hereta l’alçada?
Una bona activitat per treballar la recollida de dades és la que proposa el grup Vilatzara S’hereta l’alçada?, a través d’un article de The Bone Science o a través de l’article del diari La Razón, en els quals s’anima l’alumnat a predir si hi ha una relació entre l’alçada dels progenitors i la seva alçada i si és fiable la fórmula que proposa La Razón (suma les dues alçades de pare i mare)(per a una nena, resta-li 13 cm, per a un nen, suma-li 13 cm i el resultat, el divideixes per 2. Aquesta serà l’alçada quan sigui gran).
Per poder fer l’estudi cal el compromís de tota la classe i, per tant, les dades recollides han d’estar disponibles per a tot el grup en un termini establert. És un bon moment per insistir en la importància de la mida de la mostra: si un alumne només utilitza dades del seu entorn familiar i rebutja les d’altres companys, els resultats no ens aportaran cap conclusió representativa.
L’activitat S’hereta l’alçada? també ens pot servir per introduir el concepte de la recta de regressió i el coeficient de correlació i, per tant, per treballar el saber#4.EST.DI.C
C. Representació de distribucions bidimensionals mitjançant núvols de punts. Recta de regressió; concepte i interpretació. Coeficient de correlació lineal: concepte i utilitat com a eina d'anàlisi.
Dues lectures
Per introduir la correlació entre variables, saber #4.EST.DI.C, pot resultar interessant la lectura a l’aula del capítol «La causalidad implica correlació (pero no a la inversa )» que apareix en el llibre ¡Que las matemáticas te acompañen! (Grima, 2018). El capítol llança una pregunta al lector: Què té a veure el consum de formatge en un país amb els beneficis obtinguts pels camps de golf?, doncs res; tanmateix, si es fa un estudi de dades es pot veure que el consum de formatge i els beneficis del camp de golf van a l’una. Grima, en el capítol, explica que hi ha una correlació directa i, quan creix el consum de formatge, els camps de golf guanyen més diners. Amb tot, no tenen res a veure perquè ni el consum de formatge causa beneficis en els camps de golf, ni la pràctica d’aquest esport incita al consum d’aquest lacti.
Altres exemples per treballar correlacions espúries, és a dir, el tipus de correlació que pot aparèixer en determinats moments o circumstàncies, però que no és fiable ni previsible per a tota la mostra o període de temps i en què, per tant, no hi ha una relació causal robusta entre dues variables, la podem trobar al web spurious correlations, en la qual podem trobar correlacions curioses i sovint divertides, com la correlació entre el nombre de cerques de JK Rowling i el preu de les accions de Coca-Cola, o que com més pel·lícules protagonitza Nicolas Cage, més persones moren ofegades en una piscina.
A l’hora d’introduir la recta de regressió, cal tenir en compte que aquesta recta és útil per resumir o aproximar el núvol de punts quan hi ha una correlació lineal i forta entre dues variables estadístiques. És important fer entendre a l’alumnat que aquesta eina s’aplica únicament en aquestes condicions i que no sempre és adequada en altres situacions; a més a més, el pendent de la recta de regressió indica la variació de la variable dependent (Y) quan la variable independent (X) augmenta una unitat. Això permet donar sentit al comportament de les dades i establir relacions directes entre elles. Tanmateix, cal posar èmfasi que l’ordenada a l’origen de la recta de regressió no sempre té sentit en funció del context i que aquesta només aproxima adequadament el núvol de punts en un interval concret de dades, i no es pot generalitzar més enllà sense una justificació. Quan la correlació és forta, la fórmula de la recta es pot utilitzar per fer inferències i predir noves dades. No obstant això, cal insistir que, si no hi ha correlació significativa, la recta de regressió no és una eina vàlida per a aquest propòsit. A més, malgrat que pugui existir una certa correlació, la reflexió sobre els fenòmens que estem representant és imprescindible per interpretar correctament les dades i evitar conclusions errònies.
Per treballar la recta de regressió, saber #4.EST.DI.C, és interessant, treballar en Geogebra i veure, creant una llista de punts, com es pot modificar la recta de regressió en variar els punts. Alhora l’activitat Recta de regressió del grup Vilatzara serveix per introduir el concepte i que l’alumnat dibuixi una recta que aproximi bé el núvol de punts, sense donar una definició formal de què vol dir aproximar bé.
Una seqüència didàctica completa per estudiar la correlació és la que proposa Mathematics Assessment Project que, com ja hem comentat, són un conjunt de materials que es van generar el 2015 en col·laboració amb la Universitat de Califòrnia, Berkeley i l’equip del Shell Center de la Universitat de Nottingham. Com a totes les lliçons proposades, hi podem trobar els materials per a l’alumnat, així com les indicacions i els suports per al professorat en el moment de dur l’activitat a l’aula. Totes les tasques s’inicien amb una preactivitat que l’alumne ha de fer individualment a casa i que serveix per valorar els coneixements previs dels estudiants sobre la temàtica de la tasca. A l’inici de la lliçó, es revisen els resultats per detectar la comprensió de la situació i possibles dificultats. A continuació, se segueix un esquema de treball individual, debats en petits grups i posada en comú a tota la classe. Al final de la lliçó, es proposa una petita avaluació o una activitat reflexiva per tal que l’alumnat sigui conscient del que ha après.
L’activitat indicada en aquest cas és Devising a Measure: Correlation, l’objectiu de la qual és explorar diferents maneres de calcular correlacions. Com sempre, farem una activitat prèvia en la qual posarem a disposició de l’alumnat un full de càlcul que, després de fer-ne una còpia, servirà per investigar què ocorre amb el coeficient de regressió en introduir nous punts, tants com indica la taula.
Font: elaboració pròpia.. El coeficient de regressió
El coeficient de correlació entre els sis valors x i els sis valors y és inicialment 0,26. Podem demanar als alumnes: quins valors d’x i y faran augmentar aquesta correlació positiva? Introduïu aquests valors a la taula o expliqueu per què aquests valors fan que la correlació positiva sigui més gran, quin és el valor més gran possible per al coeficient de correlació o els valors per a x i y que mantindran la correlació positiva, però que l’aproximin a zero. Després es pot preguntar pels valors per a x i y que donaran lloc a una correlació negativa. Recordeu als estudiants que les correlacions oscil·len entre +1 i -1 i que tots dos extrems mostren una forta correlació. Les correlacions properes a zero no mostren cap associació entre les variables.
Després, per comprovar que l’alumnat ho ha entès, treballarem la tasca Drive-in Movie Theater i els gràfics de dispersió A, B i C. L’activitat té com a protagonista a Jack, un propietari d’un cinema, el qual ha fet tres enquestes i representa els resultats en tres gràfics de punts i començarem demanant a l’alumnat que descrigui de quin tipus de correlació es tracta.
Posteriorment, es demana que els alumnes dibuixin individualment polígons al voltant dels punts. Com més petita sigui l’àrea del polígon, més forta serà la correlació. També se’ls demanarà per la idoneïtat d’aquest mètode que estableix que la correlació es pot aproximar a la inversa de l’àrea del polígon que emmarca els punts.
L’alumnat ha d’arribar a entendre que el mètode que estableix que la correlació es pot aproximar a la inversa de l’àrea del polígon que emmarca els punts no té en compte la forma del polígon. Per exemple: dos gràfics de dispersió diferents, amb el mateix nombre de punts de dades i àrees iguals que tanquen aquests punts tindran la mateixa correlació (cas de la figura 1). A més a més, la mesura de la correlació canviarà quan canviï l’escala. Per altra banda, a la figura 2 podem veure com el mètode proposat no té en compte el nombre de punts del conjunt de dades. Per exemple, en afegir punts que es troben dins de l’àrea que tanca els punts de dades hauria d’augmentar la mesura de la correlació i això no ocorre. Per altra banda, a la figura 2 també podem veure que un punt de dades atípiques pot tenir un efecte desproporcionat en la mesura de la correlació.
Com sempre, a la proposta didàctica de Mathematics Assessment s’estableixen el conjunt de bones preguntes que podem fer a l’alumnat per arribar a aquestes conclusions: Es poden dibuixar dos polígons d’aproximadament la mateixa àrea, però amb diferents correlacions? Què us diu això sobre el mètode dels polígons per calcular la correlació? Què passarà amb la correlació si la mida de la mostra augmenta, però l’àrea del polígon es manté igual? Què us diu això sobre el mètode?
Un cop vista la ineficiència del mètode d’aproximar la correlació a la inversa dels polígons que emmarquen els punts, es demana a l’alumnat que proposi nous mètodes per calcular la correlació i es recull la tasca amb anotacions i correccions del que ha fet.
Finalment, els alumnes es posen a treballar en grups reduïts per trobar el coeficient de correlació del Gràfic de dispersió B i una barra de cola. Mentre treballen en grups reduïts, podem anar observant els diversos enfocaments en què els estudiants aborden la tasca i donar-los suport per a la resolució de problemes. A continuació, podeu utilitzar la resolució del problema en les diferents estratègies dels grups de treball per centrar una discussió de tota la classe al final de la lliçó.
Candle burning
Una activitat per treballar experimentalment el saber #4.EST.DI.C és Candle burning, una tasca en què l’alumnat ha de recopilar i organitzar dades de dos variables per fer prediccions entre aquestes variables, desenvolupant la idea de correlació i concretament la correlació lineal, a través d’una espelma encesa durant un període de temps per predir quan s’apagarà. Una activitat lligada al bloc de saber#ALG.RF i al saber específic identificació d’una funció com a relació entre dues variables i l’estudi de la relació de dependència entre elles.
Correlations and regressions
Pel que fa al coeficient de correlació amb eines digitals, també és interessant conèixer la miniaplicació Correlations and regressions, en el qual podem veure com varia el coeficient de regressió segons on situem els punts.
Una bona activitat de coneixença amb els companys és també la que proposa Don Steward, en la qual es demana a un alumne que endreci per ordre de preferència les fruites, el color preferit, les assignatures… i després un company de classe farà el mateix; d’aquesta manera es generarà la representació gràfica per veure si els gustos de la classe tenen correlació.
Podem buscar activitats divertides i motivadores per a la generació de dades i posterior representació gràfica en forma de diagrama de dispersió, com la de Salt de Bungee de l’Institut Baix a Mar o les proposades al blog de Sarah Carter, activitats basades en jocs per crear diagrames de dispersió fent ús d’un Hula-hoop Scatterplot Activity en què l’alumnat es posa en forma de carrera de relleus, l’estudi de la correlació del temps que tardem a menjar regalèssies segons la seva llargada, Twizzlers Linear Regression Lab Activity, el nombre de salts que pot fer una pilota de tennis amb el temps, Bouncing Tennis Balls Linear Regression Lab, o la relació entre la mida de la mà d’una persona i la quantitat de caramels que pot agafar, Starburst Scatterplot Activity.
D. Identificació, representació i ajust de funcions de regressió no lineals (polinòmica, exponencial, logarítmica…). [AMP]
Tirar 100 daus
Per treballar l’ajust de regressions no lineals, és a dir, el saber #4.EST.DI.D, una molt bona activitat és El joc del 6 del grup cúbic,que consisteix a tirar 100 daus i retirar els daus en què ha sortit un 6 i tornem a tirar la resta; successivament, anem fent el mateix, retirant els daus amb un 6, llavors ens podrem preguntar, com evolucionarà el nombre de daus?, quantes tirades haurem d’esperar fins que ens quedi un únic dau?
Òbviament, aquesta activitat és una activitat experimental i per fer el llançament de 100 daus podem fer ús d’un simulador de mathigon en què, si seleccioneu els daus, es llancen tots a la vegada, el simulador de scratch, o donar a cada alumne de classe un dau i que estigui fora del joc si li surt un 6.
Font: elaboració pròpia.
Si recollim el nombre de daus que sobreviuen en cada tirada i en fem la representació corresponent, podrem fer l’ajust a la funció de regressió exponencial fent ús del full de càlcul; de fet podem trobar la similitud entre els daus i les cadenes de desintegració radioactives que també segueixen la mateixa llei exponencial. Podeu veure la mateixa activitat, però amb una visió de la física nuclear al blog de Joe Cossete, Radioactive Dice-Half Life Lab. El que és interessant de Cossete és com fa el gràfics dels daus que desapareixen o es desintegren en cada ronda.
També podem treballar la llei de Benford per introduir correlació no lineal d’una manera pràctica i motivadora. A classe podem explicar en què consisteix aquesta llei, basada en el fet que els nombres que comencen amb 1 apareixen més sovint que els que comencen amb altres dígits en molts conjunts de dades reals. La distribució de probabilitat per al primer dígit és aproximadament: \(P(d) = \log_{10} (1+ \frac 1 d)\)
on \(d\) és el primer dígit (1, 2, ... , 9).
Aquesta llei té la seva importància donat que una de les seves aplicacions més originals s’orienta a la valoració de l’autenticitat de les dades, especialment comptables. Així, aquesta llei s’utilitza per a la detecció de fraus. Si les dades recollides s’allunyen de la llei de Benford, es detecta un primer símptoma d’engany.
Podeu trobar referències i activitats de la llei de Benford a la campanya del CREAMAT, la Llei de Benford.
E. Ús de mitjans adequats per al tractament i estudi de distribucions bidimensionals. #ALG.PC
Tot i que és valuós traçar rectes de regressió a mà, també ho és fer servir un full de càlcul per dibuixar automàticament una línia que s’ajusta millor a les dades i donar l’equació. Fent ús dels fulls de càlcul, podem treballar el saber#4.EST.DI.E i les preguntes es poden revertir. Això és el que proposa Don Steward a scatter and correlation. Podem demanar als estudiants que generin un conjunt de dades amb correlacions particulars. Utilitzar la funció =CORREL(interval_X, interval_Y) per calcular r al full de càlcul; d’aquesta manera, ajustarem manualment els valors d’y fins a obtenir el valor de correlació desitjat o bé crear una llista de punts en Geogebra i aplicar el comandament Ajustlineal com al document recta de regressió. També podríem ampliar l’activitat experimentant amb dades que no segueixin una relació lineal i discutir com es veuria afectat r.
Per altra banda, al GeoGebra de Pep Bujosa, correlació i regressió, podeu treballar la correlació lineal d’un conjunt de dades.
Si es volen treballar amb la calculadora càlculs estadístics, podeu trobar tota la informació als canals de Webinar de Casio.
F. Càlcul i interpretació de paràmetres estadístics de centralització i dispersió.
Una activitat que permet treballar el saber #4.EST.DI.F, aparentment senzilla, però que amaga una gran riquesa, és fer dibuixar a l’alumnat el gràfic d’alçades d’una classe d’11 nois i noies que compleixi les propietats següents:
La mediana i la mitjana són aproximadament la mateixa per a un conjunt de dades que compleixen una distribució normal.
El rang és aproximadament el doble del rang interquartílic.
La desviació estàndard és aproximadament 1/4 del rang (entre un sisè i un terç).
2/3 de la població es troben entre la mitjana més o menys de la desviació estàndard.
Una bona activitat per treballar els paràmetres estadístics és estudiar com es modifica la distribució quan variem alguns dels paràmetres: podem proporcionar als alumnes un conjunt senzill de dades (per exemple: 4, 6, 8, 10, 12) i demanar-los que calculin els paràmetres inicials de centralització; la mitjana, mediana i la moda i de dispersió; el rang, la variància i la desviació típica i, després, estudiar els efectes del canvi, per exemple com es modifiquen els paràmetres quan augmenta el valor més gran del conjunt en 1 unitat (de 12 a 13), preguntar-nos quin és el paràmetre més sensible o si es duplica el valor més petit (de 4 a 8). Després podem debatre a l’aula com les mesures de centralització i dispersió no són igualment sensibles a canvis en les dades i quins canvis tenen més impacte en la mitjana o en la mediana i com afecta un valor extrem a la variància o la desviació típica.
G. Comparació de distribucions de dades atenent mesures de posició i dispersió.
Una bona activitat per explorar distribucions de dades, saber#4.EST.DI.G, és la que es proposa a l’NRICH, anomenada Data Matching, en la qual ens proporcionen 16 conjunts de dades que s’han generat a partir de 4 distribucions de probabilitat diferent; mitjançant l’estudi de patrons i el càlcul de paràmetres estadístics, l’alumnat haurà d’associar els conjunts en grups de quatre que provinguin de les mateixes distribucions.
Si, en canvi, es vol treballar la comparació de distribucions donant més importància a la representació gràfica, podem fer servir la pràctica de Sarah Carter de Boxplot and Histogram Card Sort Activity, unes targetes per relacionar els paràmetres estadístics amb els seus histogrames corresponents i diagrames de caixa.