CLIR问题88

在指出问题
2012年7月/ 8月
ISSN 1944-7639(在线版本)

内容

为数据管理挑战发声:采访Lynn Yarmey

不只是另一个聚合器:美国数字公共图书馆面临的挑战

隐藏集合注册是活的!

近期版本来自CLIR

通知:

现在注册durspace /ARL/DLF E-Science研究所
AIC Collections Care Survey将于8月30日结束
呼吁Editors-Databib

在指出问题仅以电子格式生产。以电子方式收到时事通讯,请注册LDDD乐动体育//www.yahdigg.com/pubs/issues/signup.html.内容没有版权,可以自由发布。

在Twitter @Clirnews上关注我们LDDD乐动体育


为数据管理挑战提供语言:
采访Lynn Yarmey

林恩·亚梅(Lynn Yarmey)是科罗拉多州博尔德国家冰雪数据中心(NSIDC)高级合作北极数据和信息服务(ACADIS)项目的首席数据管理员。她是2010年CLIR管理的A. R. Zipf信息管理奖学金的获得者在指出问题关于她的工作和数据策策的挑战。

置信区间:你有一个地球物理学位和mlis。告诉我们为什么您觉得需要追求科学背景的图书馆学位以及您当前的工作跨越两个领域。

我在斯克里普斯海洋学研究所做程序员分析时遇到了凯伦·贝克,她是长期生态研究(LTER)项目的信息经理和信息研究员。她给了我一种语言,用来形容我一直在做的那些看不见却无法表达的工作。作为一名数据分析师,我经历了编写非正式共享代码、处理标准化、记录“部落知识”等方面的困难。图书馆学校让我很自然地进入了信息科学领域和社区。由于我的海洋学经验,我已经对进入图书馆学校的数据景观有了一种感觉,所以它更多的是形式化的知识基础。图书馆学院真的帮助我将我的专业实践转化为LIS研究的语境和语言。

我的数据校准位置在NSIDC中是新的,实际上代表了一种新的模型,强调泛化而非专业化。I am funded by the NSF’s Advanced Cooperative Arctic Data and Information Services (ACADIS) project, in which NSIDC has partnered with the National Center for Atmospheric Research’s (NCAR) Earth Observing Laboratory (EOL), NCAR’s Computational and Information Systems Laboratory (CISL), and Unidata. I do a little of everything; my position includes a good chunk of project management in addition to facilitating communication among all four partners, developing and helping the research community implement practices upstream that will improve data standardization and reusability, and advertising data from other Arctic communities through development of a metadata broker, among other responsibilities. I am leading an ACADIS metatdata subgroup that is working across our partner organizations on issues such as data citation metadata and minimum metadata sharing within the project.

置信区间:关于数据管理,您曾说过,图书馆至少准确地阐述了问题,并努力定义了领域,但在对数据管理领域提出要求方面还不够雄心勃勃。你这话是什么意思?你认为图书馆怎样才能坚持自己的主张?

当我发表评论时,我刚刚开始研究生院,所以我当时有点天真。但查克亨利的博客(《一种文化》,2012年6月14日)关于促进合作的观点确实引起了我的共鸣。他谈到了“智力成就的竖井……被隔离在我们历史上最强大、相互联系和最灵活的信息分发系统中”的悖论,以及如果我们弥合这一鸿沟,就可以进行革命性的研究。我把数据看作是生活在这种模式下的,体现了高等教育存在的挑战和潜力。我认为数据管理需要一个整体和协作的敏感性。

全面的数据计划将为Metadata,信息组织和发现,集合开发,集合开发和保存以及研究,课程,合同和补助,可视化实验室,技术支持,技术支持,技术存储,知识产权社区等保存的专业知识。我们需要从多个角度啮合以创建此程序;数据工作无法孤立可持续地完成。每个元素都需要在他的帖子中讨论Chuck的互连和相互依存,并且可能需要从头开始构建一些关系。在现代研究的识别国家,国家和国际方面添加,以及满足数据策择需求的复杂性。然而,鉴于与教师,校园部门,联盟和国家治理模型的现有联系,理想地放置图书馆以促进数据工作。

许多项目已经扩展了他们对数据工作的定义,以包括一组协作服务。例如,PURDUE领导着CLIR资助的数据信息扫盲项目,数据和主题图书馆员正在与校园科学家合作以满足教育需求。全国图书馆员正在与研究人员合作,协助校园合同和补助人员的祝福。我的项目ASCIS正在与国际多押阿协会协调创建现场模板,以帮助Permafrost研究人员捕获上下文元数据。

置信区间:我们怎样才能产生更多的合作?什么样的全国性的对话才能促进这种合作?

各方面的领导都有机会在结构层面上处理数据问题。我们需要在技术人员、研究人员、图书管理员和数据管理员之间进行清晰而开放的交流。在许多情况下,这是一项组织和政治任务。但是在功能层面上,从集合开发、元数据和编目,到存储库开发和归档的信息素养,数据可以也应该成为库对话的一部分。没有人需要百分之百的改变,但如果每个人都稍微改变一点,带着开放的心态来到谈判桌前,我们就能达成目标。

数据管理不仅仅是图书馆的问题。我们在图书馆、数据中心、档案馆和单独的实验室中拥有如此多的专业知识,但我们并不一定有一个论坛来分享经验和知识。我认为,我们正处在,或正在接近这样一个时代,将数据管理组织作为一个联盟的概念正在获得越来越多的关注。人们意识到没有单一的数据解决方案,有一些专门的专家专注于数据生命周期的各个方面。

研究人员,数据策展人和技术人员,内部和外部图书馆,所有人都需要带到国家桌旁。在每个类别中,我们可以谈论跨尺度,交叉生命周期和跨社区表示,尽管我不确定我们作为数据社区的一个点,那么细节水平将是值得的。但是,该社区的结构,放置和领导能力将为一些非常有趣的讨论作出。我对这样一个小组的希望是数据策委的联邦网络的开头,服务和基础架构。数据中心可以提供什么库不能,反之亦然?本地规模数据管理努力在哪里适合?我们实际需要从元数据角度来看,谁最好定位,以帮助元数据创建过程的每个部分?自上而下的标准结构在哪里满足自下而上需求?我认为数据讨论已经成熟到跨越努力的协调不仅是可行的,而且非常重要。

置信区间:在过去两年中,我们在数据管理方面学到了什么?图书馆有什么经验教训?

最重要的变化是我们不再使用技术解决方案作为纯技术问题的数据。数据策策正在识别其多刻度作用。这很棒,但我们必须继续前进。在一天结束时,我们都是数据经理和数据策展人。我们不应该将数据策展视为一个完全独特的外部技能,因为图书馆员和科学家也分享了这些技能。它更加认识到常见,能够阐明它们,并开始讨论。这不是图书馆员的新角色;每个人都有一些事情要贡献,并应充满信心地进入数据策展讨论。


不只是另一个聚合器:美国数字公共图书馆面临的挑战

雷切尔·弗里克

美国数字公共图书馆(DPLA)有何不同?它如何利用数字图书馆社区和更广泛的计算机科学和网络社区所做的研究和开发来服务于更大的利益?这些问题引导了很多关于内容和范围工作流程和DPLA的技术开发工作。

DPLAtform

DPLA计划在2013年推出其首个型号。今年的重点主要集中在DPLAtform上:一组服务,用于收集通过DPLA访问的内容和集合的元数据,并使开发人员能够使用元数据构建新的应用程序,并将元数据集成到现有的站点和服务中。

第一个构建有以下目标:

  • 提供支持DPLA前端的技术平台;
  • 构建一个展示DPLA平台潜力的前端;和
  • 为开放访问存储库中的元数据提供应用程序编程接口(API)

前端开发的RFP于8月6日发布.根据释放,DPLA的第一次迭代是“朝着未来的可能性的手势,完全建立的DPLA”。

管理期望是在国家规模的数字图书馆工作的一个关键挑战。这需要时间和多次迭代。它将涉及有才能的个人,并需要广泛的利益相关者的支持。平衡长期愿景——和似乎无限的可能性——和今天可以做的事情,同时管理一系列不同的期望,将需要巨大的努力。但是实现DPLA的潜力使这种努力是值得的。

内容和范围工作流程

内容和范围工作流以容易获得的方式开始:在公共领域中已经数字化的集合,以及没有版权限制。第一步是收集表示这些集合中的数字对象的元数据。有许多成功的文化遗产聚集的例子,包括西山数码图书馆Calisphere.,明尼苏达州的数字图书馆Kenutckiana格鲁吉亚数字图书馆, 这IMLS DCC.Europeana,现在已经存在了DLF含水层项目。

对提供全国元数据聚合的一个批评是,这是不够的——没有足够的“新”,而且从表面上看,它是我们以前见过的非常基础的服务。我对这一观点提出了质疑,因为我们从未尝试在全国范围内聚集。如果我们按照我们今天所知道的那样看待提供一个国家集合的想法,并按照我们过去所做的那样进行,而不重新考虑如何做,我们将浪费努力并失去一个机会。我们需要深思熟虑、有意为之,找出需要改进的地方,以及如何转变服务的构建和呈现方式,同时关注内容将如何扩展,平台将如何被破解和分叉。有许多“大的胜利”和潜在的转型变革领域。在国家一级建立文化遗产数据存储提供了地方一级甚至区域一级所没有的杠杆作用和可能性范围。

“大胜利”的概念启动了第二个DPLA含量和范围车间8月6日在圣迪奥举行。通过解决DPLA的初始收集,我们开始了这一天,将瞄准已经取代的文化遗产内容。这个想法是DPLA可以用作元数据的“数据存储”,其代表数字化的主要资源不是现有大型书籍数字化项目的一部分。如果这是我们的主要集合发展目标,我们如何作为社区推进数字图书馆开发,并解决一些更大的挑战,即使我们尝试在本地规模上汇总内容时,我们也无法解决的更大挑战?当我们在全国范围内通过分布式网络进行聚合时,可实现的大胜利是什么?

内容和范围:期待

内容和范围工作室会议参与者将以下内容确定为提供潜在的变革变化:

这是一种能够发现和创建突发集合的方法,能够由单个最终用户以及传统存储机构动态构建集合。新出现的收藏实际上是通过将来自各种各样的收集机构和个人的信息结合在一起而创造出来的,这些信息不是由一个机构实际持有的。

创建工具和应用程序,以促进本地和单独的收集建筑,如DPLA使用情况所设想的Joanie说.DPLA可以响应当前事件,历史事件纪念日或局部事件来创建集合。一个很好的例子是与欧洲人联合移民/移民展览。紧急收集也可以参与当地社区在对话时以及他们的本地历史以及他们和他们的社区如何连接到整个美国的其他人。

一个可以处理任何类型元数据的不可知框架。有一种倾向于与我们所知道的(例如,OAI-PMH / DC)合作。DPLA提供了超越我们舒适区的机会,并造成新的东西。目前这一领域的趋势是NISO赞助的资源同步以及弗吉尼亚大学和普林斯顿大学的创业努力,这些努力将元数据记录“原子化”到它们的基本对应关系中,“重新混合”数据,并根据“调用”数据的服务动态地表示数据。是否有可能打破元数据记录,原子化记录的元素,并在全国范围内只存储记录中表示的关系?这可以是许多方法中的一种。

通过丰富的元数据提供地理,专题和时间(日期)参考/导航点的能力。位置、日期、主题/主题和/或事件信息可用于帮助用户在大型数据池中导航,为单个项目提供上下文,以及构建其他基于集合的服务。查看UIUC/ DLF Beta Sprint条目以获得这种类型的导航示例。这需要在输入点丰富元数据,并需要前端服务将数据解释为导航界面/服务。

将DPLA聚合数据转换为链接数据的可能性,作为一个链接的开放数据数据存储,反过来又可以丰富其他数字资源和收藏。Europeana提供了这个服务,丰富了很多资源,就像Wikipedia一样。

Metadata的CCO:它是我们唯一可以提供混音,重用和/或语义服务的方式,如链接的开放数据的数据存储.这是我们的特殊收藏 - 我们的独特材料 - 这将为国家数字图书馆提供最大的影响

分层发现.并非一切都必须进入大型DPLA桶并在本地索引,但它应该通过主要的DPLA搜索功能,以及通过数据收集/复合服务来呈现一些统一的方式。同样,UIUC / DLF Beta Sprint提供了这种类型的发现方法的示例。

最高层可以在DPLA内本地索引,具有完全解析/上下文化数据。最初,这被视为收获或通过原子推动到中央文化遗产DPLA数据存储的数据。可能存在几个DPLA数据存储,例如学术通信数据存储(来自大学/大学机构存储库等的数据)。第二层可能涉及使用合作伙伴的API。使用的例子是Hathitrust。第三层可能与现有的集合匹配,其中全项目元数据无法完全可用,并且只能找到收集级别,曝光最长的尾部。

创建一个全国范围的元数据存储,代表我国的文化遗产收集提供了一种挑战极限、测试新水域的方式,并成为比“只是”另一个聚合更伟大的东西。有关更新和更详细的技术信息,请访问DPLA开发wikihttp://dp.la/wiki/dev_portal.


隐藏集合注册是活的!

CLIR推出了一个注册表《隐藏特殊馆藏和档案编目》工作人员积累的未处理和最近处理的图书馆、档案和博物馆馆藏信息。该登记处的376项记录反映了藏品的多样性。每年,不仅有隐藏的书籍、图像、手稿和艺术品被提名编目,而且越来越多的音频和视听格式、地图、建筑图纸、人工制品和短命物品也引起了评审者的注意。

注册表可以通过添加到注册表的主题,关键字,格式,机构类型和年份搜索。我们希望提高对这些材料的认识,将有助于文化遗产机构吸引合作伙伴,志愿者或资助,以支持更好地保护其收藏品。此外,我们希望学者和他们的学生将使用注册管理机构找到以前未使用和未被使用的材料以及有希望的研究途径。随着我们继续添加到我们的记录,我们将致力于优化注册表的可用性和功能,以及为贡献者纠正或添加到那里的信息提供方法。

在安德鲁·w·梅隆基金会(Andrew W. Mellon Foundation)的资助下,该项目于2008年启动。从那时起,该基金会已经投资了近1600万美元,用于揭示以前隐藏的高学术价值的藏品。


近期版本来自CLIR

数据问题,作者:Lori Jahnke和Andrew Asher;斯宾塞·d·c·喀拉莱斯,查尔斯·亨利(2012年8月)介绍覆盖

数据问题检查数据管理和管理实践之间的大学研究人员和数据管理教育的现状。研究发现,很少有研究人员和学者准备应对日益增长的挑战。

“数据创造和积累的大规模规模,以及越来越多地对研究和奖学金数据的依赖,都是深刻地改变知识,发现,组织和重用的性质,”克莱尔总统查克亨利在他的介绍中。然而,我们正在回应相当困难“对研究和奖学金最为艰巨的当代挑战”。

在该报告之一,Lori Jahnke和Andrew Asher在五个高等教育机构中检查了学者的数据策策。Jahnke,Asthopology图书管理员在埃默里大学和前Clir博士后研究员以及Bucknell大学的数字倡议协调员和学术传播官,在一系列社会科学学科中对研究生,教师和研究人员进行了民族规目的访谈。在他们的主要发现之中:

  • 没有人在数据管理实践中获得正式培训,他们也没有表达他们的专业水平
  • 很少有研究人员考虑过数据的长期保存
  • 出版物输出的要求压倒了数据策择的长期考虑因素
  • 有很大的需求,有一种更有效的协作工具,以及支持生成的数据量并提供适当的隐私和访问控制的在线空间
  • 很少有研究人员知道图书馆可能提供的数据服务。

在报告的第二部分中,北德克萨斯大学(University of North Texas)数字奖学金合作项目主任、前CLIR博士后研究员Spencer D. C. Keralis提供了数据管理教育当前状态的快照。他发现,尽管LIS和学校项目正在努力开发数据管理课程,“仍有很多工作要做,以使LIS毕业生成为图书馆内外的数据专业人员。”他补充说,“LIS世界在很大程度上仍然是一个封闭的圈子,只向LIS注册者提供不同的课程。”Keralis指出,新兴课程开发项目的趋势是打开这个封闭的回路,允许学士学位后的学生和专业人士学习数据管理课程。

该报告可在//www.yahdigg.com/pubs/reports/pub154

大型数字图书馆的核心基础设施考虑,日内瓦亨利(2012年7月)

覆盖该研究考察了大型数字图书馆的基本功能方面,并利用现有数字图书馆的例子来说明它们在存储和内容交付、元数据方法和收获、搜索和发现、服务和应用以及系统可持续性方面的不同方法。

“决定建立一个大型数字图书馆的决定必须一定是一套复杂的考虑因素,”写作报告作者日内瓦亨利。“一个领域的决定将影响其他领域的决策。”Dea University的Fordren图书馆的数字奖学金执行董事亨利将报告写着,作为来自安德鲁W.Mellon基金会的Clir的一部分,为此开发了一个原型数字公共图书馆(DPLA)。

作者强调,可伸缩性对于实现系统的长期增长至关重要,她建议使用遵循SOA原则的模块化系统,以实现灵活性、代码重用性和更强的系统可持续性。她还强调了在与数字图书馆互动时了解目标受众及其需求的重要性。随着实现的开始,她建议建立一个沙箱环境来试验不同的技术和架构。最后,重要的是要决定一个现实的可持续性计划,并公布有助于实施该计划的政策和指导方针。

大型数字图书馆的核心基础设施考虑可在//www.yahdigg.com/pubs/reports/pub153


通知

现在注册durspace /ARL/DLF E-Science研究所

2012年9月6日至2012年12月13日,电子科学研究所仍有一些名额空缺。

电子科学研究所旨在帮助学术和研究图书馆制定电子研究支持的战略议程,特别关注科学。该研究所由一系列互动模块组成,通过动态学习过程,让来自学术机构的个人小团队加强和推进他们支持计算科学研究的策略。课程以团队在其机构完成的一系列练习开始,并以一个现场研讨会结束。当地机构的任务帮助工作人员建立对研究支持背景需求和问题的高水平理解。

有关该研究所的更多信息,或注册,访问http://duraspace.org/esi-logistics

AIC Collections Care Survey将于8月30日结束

美国自然保护协会(AIC)邀请藏品管理人员、准备人员和其他藏品保存方面的专家参与一项调查,以帮助确定当今藏品护理专业人员面临的机遇和挑战。该调查可于http://www.surveymonkey.com/s/collectionscaresurvey.8月30日结束。

呼吁Editors-Databib

Databib是帮助人们识别和定位研究数据的在线存储库的工具。在DataBib中已在数据库中编目了200多个数据存储库,每周都会增加更多。用户和书目创建和策划描述用户可以浏览和搜索的数据存储库的记录。

正在征求一位编辑委员会的提名,以确保数据磁带的覆盖率和准确性。编辑者理想地将在特定的地理区域中的特定研究领域或研究数据存储库的知识以及具有描述性元数据的经验中具有专业知识。编辑的主要作用是审查,编辑和批准向数据机提交的提交,并有助于增强数据键的元数据和志愿者为自愿,三年期限。编辑委员会将每年至少举行两次(几乎),并将根据电子邮件的需要进行对应。

请将提名或问题发送至databib@gmail.com.,或者访问http://databib.org/about.php.为更多的信息。


你喜欢这篇文章吗?请分享!

在facebook上分享
脸谱网
分享到Twitter
推特
分享在linkedin
linkedin.
在pinterest分享
Pinterest.
分享Reddit.
Reddit

相关文章

CLIR问题140.

3月140日3月2021年4月2021年ISSN 1944-7639(在线版)内容CLIR的数字化隐藏集合计划奖项40.2百万到16个项目呼吁提案:DLF论坛

CLIR问题139.

139年139年1月/ 2月2021年1月2021年ISSN 1944-7639(在线版)内容Mellon基金会资金Clir的数字化隐藏的集合和档案:放大闻名的声音与CLIR的三个问题

CLIR问题138.

ISSN 1924 -7639(在线版)内容CLIR与HBCU图书馆联盟研究HBCU图书馆CLIR板大规模调查的可行性

跳到内容